복습

코랩 결손데이터 처리하기

glenlee 2024. 2. 14. 17:40
from google.colab import drive
drive.mount("/content/drive")

구글 코랩과 구글 드라이브 연동

import pandas as pd

titanic_df = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/멀티캠퍼스34/ML_glen/data/titanic_train.csv")
titanic_df.head(3)

다운로드 받은 csv 파일 폴더 찾아서 지정하기

 

titanic_df.isna().head(3)
결측치가 있으면 True 를 출력한다

 

 

 

titanic_df.isna().sum()
결측치의 합을 출력한다

 

titanic_df['Cabin'] = titanic_df['Cabin'].fillna('C000')
titanic_df['Age'] = titanic_df['Age'].fillna(titanic_df['Age'].mean())
titanic_df['Embarked'] = titanic_df['Embarked'].fillna('S') #
 
titanic_df.isna().sum()
결측치가 0 이 돼었다

 

'복습' 카테고리의 다른 글

240108  (0) 2024.01.08
240107  (0) 2024.01.07
230105복습  (0) 2024.01.07
matplotlib 그래프그리기 '기본사용' 튜토리얼 따라해보기  (0) 2024.01.06
240104복습  (1) 2024.01.05