DataAnalysis/개념정리
pandas 걸측데이터 정리
_DAMI
2022. 4. 24. 22:50
1.걸측데이터 확인
df.isnull( )
2.결측값 개수
df.isnull().sum()
3.결측치가 있는 전체 행 제거
df_drop_allrow = df.dropna(axis=0)
df_drop_allrow
4.특정 행 또는 열 결측치 제거
df['컬럼'].dropna()
5.결측값을 특정 값(0)으로 대체
df_1 = df.fillna(0)
6.특정항목 평균으로 대체
df_7 = df.컬럼.fillna(df.mean()['컬럼'])
df_7
df['kor']=df['kor'].fillna('10d')
df
7.duplicated() 메소드로 중복 데이터 찾기
df.duplicated(['이용거리','나이'])
8.이상값이 있는 4번째 행 제거
df.drop(4,axis=0)
9. drop_duplicates()는 중복값을 keep='first', 'last', False argument에 따라 유일한 1개의 key값만 남기고 나머지는 중복 제거
df.drop_duplicates(['컬럼'],keep='first')