데이터 준비

Untitled

결측치 처리

결측치 처리: 개수 확인

# 결측치 개수
df.isnull().sum()
# 결측치 개수 (전체)
df.isnull().sum().sum()
df.dropna() # df.dropna(axis=0)

Untitled

결측치 처리: 데이터 혹은 컬럼 삭제

df.dropna(axis=1)

Untitled

df.dropna(axis=1, how='all') # 컬럼의 모든 값이 NaN 경우만

Untitled

결측치 처리: 대체 (imputation)

df.median()
# 결측치를 median으로 대체
df.fillna(df.median())

Untitled

Outlier 탐지