DS & ML

[DS] Missing data를 다루는 대표적인 방법들

DevDr 2022. 10. 7. 18:55
반응형

랜덤하게 채워넣기
주변 행의 값들로 채워넣기
열의 대표값을 계산해서 채워넣기 (평균, 중위값, 최빈값 등)
전체 행들을 그룹으로 묶어낸 후 그룹 내 해당 열의 대표값으로 채워넣기
나머지 열들로 머신러닝 모델을 만든 후 해당 열의 값을 예측해 채워넣기
특정 기준 비율 이상으로 빠져있을 시 해당 열 삭제

상황에 따라 적절하게 선택한다

반응형

'DS & ML' 카테고리의 다른 글

모두를 위한 머신러닝/딥러닝  (0) 2023.07.16
[DS] MacOS에 MySQL 설치 (M1)  (0) 2023.04.03
[ML] Introduction  (0) 2022.10.01