반응형
결측치 처리하기
먼저 info()를 찍어 각 컬럼의 상태에 대해 확인한다.
row는 총 99441개 있는 걸 확인할 수 있다.
다음 null값이 있는지 확인해본다.
데이터.isnull().sum()을 찍어보면 컬럼별로 null값이 얼마나 있는지 확인할 수 있다.
.
null값이 있는 세 컬럼의 null값 총합을 더하면 4908개, 즉 모든 컬럼의 null값이 4908개 있다는 것이다.
null값이 있는 행들을 모아주겠다.
이때 any 옵션을 주어서 컬럼 중 하나라도 null값이 있을 경우 선택이 되도록 하였다.
총 2980개의 row가 선택되었다.
dropna를 사용해서 null값이 존재하는 행들을 제거해준다.
이때 행을 제거해주는 거기 때문에 옵션을 axis=0 으로 준다.
그리고 인덱싱을 재지정한다.
총 96461개의 행이 출력되는 걸 확인할 수 있다.
원래 행이 99441개 있었고 여기에 결측치가 포함된 행 2980개를 제거해주었으니 96461개 행이 나오는 게 맞다.
반응형
'데이터' 카테고리의 다른 글
엑셀 기초 - Vlookup함수 테이블 작성 방법 (0) | 2020.09.16 |
---|---|
엑셀 기초 - Vlookup함수와 Hlookup함수 (0) | 2020.09.16 |
파이썬 실습 - 이상치(Outliers) 제거하기 (0) | 2020.09.16 |
파이썬 실습 - '민간 아파트 가격동향' 데이터 전처리 (0) | 2020.09.16 |
파이썬 기초 - 전처리 과정에서 사용되는 다양한 함수(2) (0) | 2020.09.16 |