DataAnalysis/개념정리

pandas 걸측데이터 정리

_DAMI 2022. 4. 24. 22:50

1.걸측데이터 확인

df.isnull( )

2.결측값 개수
df.isnull().sum()

 

3.결측치가 있는 전체 행 제거
df_drop_allrow = df.dropna(axis=0)
df_drop_allrow

 

4.특정 행 또는 열 결측치 제거

df['컬럼'].dropna()

 

5.결측값을 특정 값(0)으로 대체
df_1 = df.fillna(0)

 

6.특정항목 평균으로 대체 
df_7 = df.컬럼.fillna(df.mean()['컬럼'])
df_7

df['kor']=df['kor'].fillna('10d')
df

7.duplicated() 메소드로 중복 데이터 찾기
df.duplicated(['이용거리','나이'])

 

8.이상값이 있는 4번째 행 제거 
df.drop(4,axis=0)

 

9. drop_duplicates()는 중복값을 keep='first', 'last', False argument에 따라 유일한 1개의 key값만 남기고 나머지는 중복 제거
df.drop_duplicates(['컬럼'],keep='first')