[Machine Learning] Scaling, Z-score, 전처리 과정
Scikit-learn에서 Scaling은 데이터의 값 범위를 일정한 범위로 조정하거나 특징들 간의 크기 차이를 조정하는 과정이다.scale 조정 기법 중 가장 간단한 방법이, min-max scaling StandardScaler 함수는 데이터를 평균이 0, 표준편차가 1인 형태로 변환해주는 함수다.이때, 값이 0과 1사이에 무조건 들어와야하는 것은 아니며, 가우시안 분포를 따른다고 할 때, 저 범위를 넘어가는 수도 충분히 존재할 수 있다. 그러나 왠만한 값들은 저 범위안에 들어간다*아웃라이어, Outlier : 전체 데이터의 흐름에서 벗어난 튀는 값을 말한다. 이상치라고도 한다.Z-score : 데이터가 평균에서 얼마나 떨어져 있는지를 "표준편차 단위"로 나타낸 값Z = 0 평균과 같음Z = 1 평균..