PCA

    주성분분석(Principal Component Analysis)

    # 1 주성분 분석이란? 주성분 분석은 차원 축소(dimensionality reduction)과 변수 추출(feature extraction) 기법으로 널리 사용되고 있다. PCA는 높은 차원의 데이터 분포에서 낮은 차원의 정사영된 축을 찾는 방식으로 차원을 축소시킨다. 이 때 축과 데이터 간의 오차는 최소화 하고, 데이터의 분산은 최대한 유지시킬 수 있는 축을 찾는 걸 목표로 하고, 아래의 그림이 그 과정을 보여준다. # 2 . 공분산(Covariance) 공분산이란? 2개의 확률변수의 상관 정도를 나타내는 값이다. Cov(X,Y) > 0 : 확률변수 X가 증가할 때 Y가 증가하면, 공분산은 0보다 큰 값을 가진다. Cov(X,Y) < 0 : 확률변수 X가 증가할 때 Y가 감소하면, 공분산은 0보다 ..