자격증/빅데이터분석기사

[빅분기] 제 1유형 연습

K_Hyul 2024. 7. 4. 10:26
728x90

빅데이터분석기사 같은 경우 1유형에는 여러 유형의 문제가 있다.

 

중요도 순서 상관없이 생각 나는데로 정리 해보았다.

 

- 데이터의 count, mean, std, min, 1/4, 2/4, 3/4, max 값이 출력되는 것

df.describe()

 

- IQR

q1 = df['target'].quantile(1/4)
q3 = df['target'].quantile(3/4)
iqr = q3 - q1
min = q1 - 1.5*iqr
max = q3 + 1.5*iqr

print(len(df[(df['target']>min) | (df['target']<max)]['target']))

 

- zscore

from scipy.stats import zscore
sub = '목표 column'
result = zscore(df[sub].dropna()).max()

 

- 상관계수들 중 특정 값 찾기

sub = df.corr()['target'].abs().sort_values().index[-2]
ans = df[sub].mean()
print(ans)

 

 

 

728x90

'자격증 > 빅데이터분석기사' 카테고리의 다른 글

[빅분기] 제 3유형 연습  (0) 2024.07.04
[빅분기] 제 2유형 연습  (0) 2024.07.04
(pandas) file 다루기  (0) 2023.12.27
(pandas) csv 파일 불러오기  (1) 2023.12.27