자격증/빅데이터분석기사
[빅분기] 제 1유형 연습
K_Hyul
2024. 7. 4. 10:26
728x90
빅데이터분석기사 같은 경우 1유형에는 여러 유형의 문제가 있다.
중요도 순서 상관없이 생각 나는데로 정리 해보았다.
- 데이터의 count, mean, std, min, 1/4, 2/4, 3/4, max 값이 출력되는 것
df.describe()
- IQR
q1 = df['target'].quantile(1/4)
q3 = df['target'].quantile(3/4)
iqr = q3 - q1
min = q1 - 1.5*iqr
max = q3 + 1.5*iqr
print(len(df[(df['target']>min) | (df['target']<max)]['target']))
- zscore
from scipy.stats import zscore
sub = '목표 column'
result = zscore(df[sub].dropna()).max()
- 상관계수들 중 특정 값 찾기
sub = df.corr()['target'].abs().sort_values().index[-2]
ans = df[sub].mean()
print(ans)
728x90