50

  • 홈
  • 태그
  • 방명록

SimpleImputer 1

[ML/python] 결측값 처리 (SimpleImputer, KNNImputer)

머신러닝을 위한 전처리 과정 중 결측값을 처리하는 방법이다. import pandas as pddf = pd.read_csv("mldata.csv")# X,y 분리X = df.drop('y', axis = 1)y = df['y']# validationfrom sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 50)  결측값 확인 및 제거df.isnull().sum(axis = 0) #결측값 확인df.dropna(inplace = True) #결측값 제거  결측값 대체 - ① 대푯값평균, 중앙값, 최빈값 등을 사용한다.from sklearn.i..

⚙️ Tech/ML 2025.02.09
이전
1
다음
더보기
프로필사진

50

데이터 통역가

  • 분류 전체보기 (48)
    • ⚙️ Tech (35)
      • DB (7)
      • ML (18)
      • PySpark (2)
      • Pandas (5)
      • etc. (3)
    • 📊 Stat (1)
    • 🚀 Growth (5)
    • 📚 Book (1)
    • 🦁 Bootcamp (5)

최근글과 인기글

  • 최근글
  • 인기글

Tag

데이터분석, sql, 그로스마케팅, 데스크리서치, mongoclient, 멋쟁이사자처럼후기, pysprk, subplots, KNNImputer, 기타옵션, GA4, 그로스해킹, 라인차트, 시각화 라이브러리, 데이터마케팅, PYTHON, 박스플롯, 메타광고, looker studio, SimpleImputer,

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바