-
pandas 걸측데이터 정리DataAnalysis/개념정리 2022. 4. 24. 22:50
1.걸측데이터 확인
df.isnull( )
2.결측값 개수
df.isnull().sum()3.결측치가 있는 전체 행 제거
df_drop_allrow = df.dropna(axis=0)
df_drop_allrow4.특정 행 또는 열 결측치 제거
df['컬럼'].dropna()
5.결측값을 특정 값(0)으로 대체
df_1 = df.fillna(0)6.특정항목 평균으로 대체
df_7 = df.컬럼.fillna(df.mean()['컬럼'])
df_7df['kor']=df['kor'].fillna('10d') df
7.duplicated() 메소드로 중복 데이터 찾기
df.duplicated(['이용거리','나이'])8.이상값이 있는 4번째 행 제거
df.drop(4,axis=0)9. drop_duplicates()는 중복값을 keep='first', 'last', False argument에 따라 유일한 1개의 key값만 남기고 나머지는 중복 제거
df.drop_duplicates(['컬럼'],keep='first')'DataAnalysis > 개념정리' 카테고리의 다른 글
pandas dataframe 정리2 (0) 2022.04.24 pandas dataframe 정리 (0) 2022.04.24 Beautifulsoup 기본 정리 : 속성 및 태그 가져오기 (0) 2022.04.22 pandas dataframe csv파일 읽기, 만들기 (0) 2022.04.17