# 1 ์ฃผ์ฑ๋ถ ๋ถ์์ด๋?
์ฃผ์ฑ๋ถ ๋ถ์์ ์ฐจ์ ์ถ์(dimensionality reduction)๊ณผ ๋ณ์ ์ถ์ถ(feature extraction) ๊ธฐ๋ฒ์ผ๋ก ๋๋ฆฌ ์ฌ์ฉ๋๊ณ ์๋ค. PCA๋ ๋์ ์ฐจ์์ ๋ฐ์ดํฐ ๋ถํฌ์์ ๋ฎ์ ์ฐจ์์ ์ ์ฌ์๋ ์ถ์ ์ฐพ๋ ๋ฐฉ์์ผ๋ก ์ฐจ์์ ์ถ์์ํจ๋ค. ์ด ๋ ์ถ๊ณผ ๋ฐ์ดํฐ ๊ฐ์ ์ค์ฐจ๋ ์ต์ํ ํ๊ณ , ๋ฐ์ดํฐ์ ๋ถ์ฐ์ ์ต๋ํ ์ ์ง์ํฌ ์ ์๋ ์ถ์ ์ฐพ๋ ๊ฑธ ๋ชฉํ๋ก ํ๊ณ , ์๋์ ๊ทธ๋ฆผ์ด ๊ทธ ๊ณผ์ ์ ๋ณด์ฌ์ค๋ค.
# 2 . ๊ณต๋ถ์ฐ(Covariance)
๊ณต๋ถ์ฐ์ด๋?
2๊ฐ์ ํ๋ฅ ๋ณ์์ ์๊ด ์ ๋๋ฅผ ๋ํ๋ด๋ ๊ฐ์ด๋ค.
Cov(X,Y) > 0 : ํ๋ฅ ๋ณ์ X๊ฐ ์ฆ๊ฐํ ๋ Y๊ฐ ์ฆ๊ฐํ๋ฉด, ๊ณต๋ถ์ฐ์ 0๋ณด๋ค ํฐ ๊ฐ์ ๊ฐ์ง๋ค.
Cov(X,Y) < 0 : ํ๋ฅ ๋ณ์ X๊ฐ ์ฆ๊ฐํ ๋ Y๊ฐ ๊ฐ์ํ๋ฉด, ๊ณต๋ถ์ฐ์ 0๋ณด๋ค ์์ ๊ฐ์ ๊ฐ์ง๋ค.
Cov(X,Y) = 0 : ๋ ๋ณ์์๋ ์ด๋ ํ ์ ํ ๊ด๊ณ๋ ์์ผ๋ฉฐ, ๋ ๋ฆฝ๊ด๊ณ๋ผ๋ฉด ๊ณต๋ถ์ฐ ๊ฐ์ 0์ ๊ฐ์ง๋ค. ํ์ง๋ง, ๊ณต๋ถ์ฐ ๊ฐ์ด 0์ด๋ผ๊ณ ํด์ ๋ชจ๋ ๋ ๋ฆฝ์ด๋ผ๊ณ ๋ณผ ์๋ ์๋ค.
์ด๋ฌํ ๊ณต๋ถ์ฐ์ ๋ ๋ณ์์ ๋ํ ์๊ด ๊ด๊ณ์ ๋ํด์๋ง ์ ์ ์๊ณ , ๊ทธ ์ ๋์ ๋ํด์๋ ์ ์ ์๋ค. ์ด ๋ ์ฌ์ฉํ๋ ๊ฒ ๋ฐ๋ก ์๊ด ๊ณ์๋ค.
๊ณต๋ถ์ฐ ํ๋ ฌ์ ์๋ฏธ๋ ๊ทธ๋ ๋ค๋ฉด, ์ผ๋ง๋งํผ ๋ ๋ณ์๊ฐ ํจ๊ป ๋ณํ๋์ง๋ฅผ ํ๋ ฌ์ ๋ํ๋ด๊ณ ์๋ค. ๊ทธ๋ฆฌ๊ณ ๊ธฐํํ์ ์ผ๋ก๋ ์๋ ๊ทธ๋ฆผ์ฒ๋ผ ๋ณผ ์ ์๋ค.
# 3 . ๊ณ ์ ๊ฐ(Eigenvalue)๊ณผ ๊ณ ์ ๋ฒกํฐ(EigenVector)
๊ณ ์ ๋ฒกํฐ๋?
๋ฒกํฐ๊ณต๊ฐ์์ ์ ํ ๋ณํ์ ์ํด์ ๋ณํ ๊ฒฐ๊ณผ๊ฐ ์์๋ฐฐ๊ฐ ๋๋ ๋ฒกํฐ๋ฅผ ๋งํ๊ณ ์ด ๋ ์์๋ฅผ ๊ณ ์ ๊ฐ์ด๋ผ๊ณ ํ๋ค.
# 4. PCA ๊ณผ์
์์ ๋์๋ ๊ณต๋ถ์ฐ ํ๋ ฌ๊ณผ, ํ๊ท ๋ฒกํฐ๋ฅผ ์ด์ฉํ์ฌ ๊ณ ์ ๋ฒกํฐ๋ฅผ ๊ตฌํ๊ณ ๊ทธ ์ค ๊ฐ์ฅ ํฐ ๊ฐ์ ํตํด ์ต์ ์ ์ถ์ ์ฐพ์ ์ ์๋ค. ํ์ง๋ง, ๊ณ ์ ๋ฒกํฐ๋ฅผ ํตํด ์ ํ๋ณํํ๋ ๋ฐฉ์์ผ๋ก ์๋ํ๋ฏ๋ก, ์ ํ ๋ฐ์ดํฐ๊ฐ ์๋ ๊ฒฝ์ฐ์๋ ์ ์๋ํ์ง ์๋๋ค๋ ํ๊ณ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ๋ฐ๋ผ์ ๋ณดํต PCA๋ณด๋ค๋ tSNE๋ฅผ ๋ ๋ง์ด ์ฌ์ฉํ๋ค.
'๐๏ธData Science > Aritificial Intelli' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๊ฐํํ์ต(Reinforcement Learning) - 3.DQN (0) | 2022.12.07 |
---|---|
๊ฐํํ์ต(Reinforcement Learning) - 2.Q-learning (0) | 2022.12.07 |
๊ฐํํ์ต(Reinforcement Learning) - 1.Value Function (0) | 2022.12.07 |
Pattern mining (0) | 2022.11.26 |