728x90
빅데이터분석기사 같은 경우 1유형에는 여러 유형의 문제가 있다.
중요도 순서 상관없이 생각 나는데로 정리 해보았다.
- 데이터의 count, mean, std, min, 1/4, 2/4, 3/4, max 값이 출력되는 것
df.describe()
- IQR
q1 = df['target'].quantile(1/4)
q3 = df['target'].quantile(3/4)
iqr = q3 - q1
min = q1 - 1.5*iqr
max = q3 + 1.5*iqr
print(len(df[(df['target']>min) | (df['target']<max)]['target']))
- zscore
from scipy.stats import zscore
sub = '목표 column'
result = zscore(df[sub].dropna()).max()
- 상관계수들 중 특정 값 찾기
sub = df.corr()['target'].abs().sort_values().index[-2]
ans = df[sub].mean()
print(ans)
728x90
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
[빅분기] 제 3유형 연습 (0) | 2024.07.04 |
---|---|
[빅분기] 제 2유형 연습 (0) | 2024.07.04 |
(pandas) file 다루기 (0) | 2023.12.27 |
(pandas) csv 파일 불러오기 (1) | 2023.12.27 |