# 1 .์นด์ด์ ๊ณฑ ๊ฒ์ ์ด๋?
- $X^2$๊ฒ์ ์ ์นด์ด์ ๊ณฑ ๋ถํฌ์ ๊ธฐ์ดํ ํต๊ณ์ ๋ฐฉ๋ฒ
- _๊ด์ฐฐ๋ ๋น๋๊ฐ ๊ธฐ๋๋๋ ๋น๋์ ์ ์ํ๊ฒ ๋ค๋ฅธ์ง๋ฅผ ๊ฒ์ฆ_
- ๋ฒ์ฃผํ ์๋ฃ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ ๋ถ์์ ์ด์ฉ
- ์นด์ด์ ๊ณฑ ๊ฐ์ $X^2 = \sum(๊ด์ธก๊ฐ - ๊ธฐ๋๊ฐ)^2/๊ธฐ๋๊ฐ$
- ์นด์ด์ ๊ณฑ ๊ฒ์ ์ ํํ
- ์ ํฉ๋ ๊ฒ์ (Goodness of fit test)
- ๋์ง์ฑ ๊ฒ์ (Test of Homogeneity)
- ๋ ๋ฆฝ์ฑ ๊ฒ์ (Test of independence)
# 2 . ์ ํฉ๋ ๊ฒ์ (One Sample Test)
์ ํฉ๋ ๊ฒ์ ์ด๋? ๋จ์ผ ํ๋ณธ์์ ํด๋น ํ๋ณธ์ด ์ ์๋ฏธํ์ง๋ฅผ ๊ฒ์ ํ๊ณ , ์์ ๋๋ "์ข ์๋ณ์์ ๋ฒ์ฃผ -1"์ด๋ค.
์๋ฅผ ๋ค์๋ฉด, ์ฃผ์ฌ์๋ฅผ 120๋ฒ ๋์ก๋ค๊ณ ํ์ ๋, 1~6๋ฒ๊น์ง ๊ธฐ๋๊ฐ์ ๊ฐ๊ฐ 20์ด๋ผ๊ณ ํ ์ ์๋ค. ๊ทธ ๋ ์ค์ ๋ก ๋์จ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ , ๊ทธ ๋ฐ์ดํฐ๊ฐ ์ ์๋ฏธํ์ง๋ฅผ ๊ฒ์ ํด๋ณผ ๋ ์ฌ์ฉํ๋ค.
# 3 . ๋์ผ์ฑ ๊ฒ์ ๊ณผ ๋ ๋ฆฝ์ฑ ๊ฒ์
๋์ผ์ฑ ๊ฒ์ ๊ณผ ๋ ๋ฆฝ์ฑ ๊ฒ์ ์ด๋?
๋์ผ์ฑ ๊ฒ์ ๊ณผ ๋ ๋ฆฝ์ฑ ๊ฒ์ ๋ชจ๋ ๋ณ์๋ค์ด ์๋ก ๊ด๋ จ์ด ์๋์ง ๋๋ ๋ฌด๊ดํ์ง๋ฅผ ์ฌ๋ถ๋ฅผ ๊ฒ์ ํ๋ ๋ฐ ์ฐ์ธ๋ค. ์๋ฅผ ๋ค๋ฉด, ํก์ฐ๊ณผ ํ์๊ฐ์ ๊ด๋ จ์ฑ์ ์์๋ณด๊ธฐ ์ํด์ ํก์ฐ์ฌ๋ถ์ ํ์์ฌ๋ถ๋ฅผ ์กฐ์ฌํ์ฌ ๊ฒ์ ํ๋ฉด ๋ ๋ฆฝ์ฑ ๊ฒ์ (๋ณ์๊ฐ 2๊ฐ)์ด ๋๊ณ , ํก์ฐ์์ ๋นํก์ฐ์๊ตฐ์ ๋๋์ด ํ์์ฌ๋ถ๋ฅผ ์กฐ์ฌํ๋ค๋ฉด ๋์ผ์ฑ ๊ฒ์ (ํ๋์ ๋ณ์์ ํ๋์ ๊ทธ๋ฃน)์ด ๋๋ค.
์ด ๋, ๋ ๊ฒ์ ๋ชจ๋ ๋ฒ์ฃผํ ๋ณ์์๋ง ๊ฐ๋ฅํ๋ฏ๋ก , ๋ณ์์ ๋ํ ํต๊ณ๋ถํ ํ๋ฅผ ๋ง๋ ๋ค.
ํต๊ณ ๋ถํ ํ๋? ๋ ๋ณ์๊ฐ ๋ชจ๋ ๋ฒ์ฃผํ ๋ณ์์ผ ๋, ๋์๋ถํฌํ๋ฅผ 2์ฐจ์ ํํ๋ก ๋ํ๋ธ ํ์ด๋ค.
๊ทธ๋ฆฌ๊ณ ์นด์ด์ ๊ณฑ ๊ฐ์ ๊ตฌํ๊ธฐ ์ํด์๋ ๊ด์ธก ๋น๋์ ๋๋ธ์ด ์์ธก ๋น๋๋ฅผ ๊ตฌํด์ผ ํ๋ค.
์์ธก ๋น๋๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํ ์ ์๋ค.
์นด์ด์ ๊ณฑ ๊ฐ์ ๋ชจ๋ ํฉํ ๊ฒ์ ๊ฒ์ ํต๊ณ๋์ผ๋ก ์ค์ ํ๊ณ , ๊ฒ์ ์ ์งํํ๋ค.
https://nate9389.tistory.com/1727
์ด ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์์ฑํ์์ต๋๋ค.
from scipy.stats import chi2_contingency
chi2, p_val, d_f, expected = chi2_contingency(data)
print(chi2) #๊ฒ์ ํต๊ณ๋
print(p_val) #P-value๊ฐ
print(expected) #๊ธฐ๋ ๋น๋ ๊ณ์ฐ Array
# 4. ์ฐ๋๋น ๊ฒ์ (Likelihood ratio test)
# 5 . Fisher Exact Test
ํผ์ ์ ํ๊ฒ์ฌ๋?
์ํ ์๊ฐ ๋๋ฌด ์ ๊ฑฐ๋, ๊ธฐ๋๋น๋๊ฐ 5 ์ดํ์ ์ ์ด 20%์ด ๋๋ ๊ฒฝ์ฐ์ ์นด์ด์ ๊ณฑ ๊ฒ์ ๋์ ์ฌ์ฉํ๋ค. ์ฝ๊ฒ ๋งํด ์นด์ด์ ๊ณฑ ๊ฒ์ ์ ๊ฐ์ ์ ์ถฉ์กฑํ์ง ๋ชปํ์ ๋ ์ฌ์ฉํ๋ ๊ฒ์ ์ด๋ผ ์๊ฐํ๋ฉด ๋๋ค.