본문 바로가기

데이터

파이썬 실습 - 결측치(null) 처리하기

반응형

결측치 처리하기

 

 

 


 

 

먼저 info()를 찍어 각 컬럼의 상태에 대해 확인한다.

row는 총 99441개 있는 걸 확인할 수 있다.

 

 

 

 

 

 

 

다음 null값이 있는지 확인해본다.

데이터.isnull().sum()을 찍어보면 컬럼별로 null값이 얼마나 있는지 확인할 수 있다.

 

 

.

 

 

null값이 있는 세 컬럼의 null값 총합을 더하면 4908개, 즉 모든 컬럼의 null값이 4908개 있다는 것이다.

 

 

 

 

 

 

null값이 있는 행들을 모아주겠다.

이때 any 옵션을 주어서 컬럼 중 하나라도 null값이 있을 경우 선택이 되도록 하였다.

총 2980개의 row가 선택되었다.

 

 

 

 

 

 

 

 

dropna를 사용해서 null값이 존재하는 행들을 제거해준다.

이때 행을 제거해주는 거기 때문에 옵션을 axis=0 으로 준다.

그리고 인덱싱을 재지정한다.

 

 

 

총 96461개의 행이 출력되는 걸 확인할 수 있다.

원래 행이 99441개 있었고 여기에 결측치가 포함된 행 2980개를 제거해주었으니 96461개 행이 나오는 게 맞다. 

반응형