Binomial Distribution์ Bernoulli Distribution with mutliple trials๋ก ์ดํดํ๋ฉด ์ข์ต๋๋ค.
For a random variable X, ์ด๋ฒคํธ์ ๊ฒฐ๊ณผ๊ฐ ๋๊ฐ์ ์ต์ ๋ฐ์ ์กด์ฌํ์ง ์๋๋ค๋ฉด, ์ด๋ฅผ ์ฐ๋ฆฌ๋ ๋ฒ ๋ฅด๋์ด ๋ถํฌ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
ํ๋ฅ p์ ๋ํ์ฌ X~Bern(p)๋ก ํ๊ธฐํ๊ณ , ์ด๋ X~B(1,p)์ ๋์ผํฉ๋๋ค.
๋ฒ ๋ฅด๋์ด ๋ถํฌ์ ๋ํด์ ์กฐ๊ธ๋ง ๋ ์์๋ณด์๋ฉด,
E(x) = 1*p + 0*(1-p) = p
Variance = p(1-p)
STDEV = sqrt(p(1-p))
์ ๋๋ค.
๊ด๋ก์ ์ผ๋ก ์ฐ๋ฆฌ๋ ๋๊ฐ์ ๊ฒฐ๊ณผ ์ค ๋์ฑ ํ๋ฅ ์ด ๋์ ๊ฒฐ๊ณผ๋ฅผ p๋ก, ๊ทธ๋ ์ง ์์ ๊ฒ์ 1-p, ํน์ q๋ก ๋ํ๋ ๋๋ค.
๋ํ, ์ฐ๋ฆฌ๋ ๋ฒ ๋ฅด๋์ด ๋ถํฌ๋ฅผ ์ ์ฉํ๊ณ ์ถ์ ์ํฉ์, ๊ฐ ์ด๋ฒคํธ์ 1๊ณผ 0์ assignํด์ค์ผ ํ ๋๊ฐ ์์ต๋๋ค.
์ฌ๊ธฐ์๋ ์ฐ๋ฆฌ๋ ๊ด๋ก์ ์ผ๋ก p์ ํ๋ฅ ์ ๊ฐ์ง๋ (ํ๋ฅ ์ด ๋ ๋์) ๊ฒฐ๊ณผ์ 1์, ๊ทธ๋ฆฌ๊ณ ๋ฐ๋์ชฝ์ 0์ ๋ถ์ฌํฉ๋๋ค.
๋ค์ Binomial Distribution์ผ๋ก ๋์๊ฐ์,
์๊ธฐํ๋ฏ ์ดํญ๋ถํฌ๋ ๋ฒ ๋ฅด๋์ด ๋ถํฌ์ ๋ฐ๋ณต์ผ๋ก ์ดํดํ๋ฉด ์ง๊ด์ ์ ๋๋ค.
์ฐ๋ฆฌ๋ ์ดํญ ๋ถํฌ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ํ์ํฉ๋๋ค.
X~B(n,p)
์ด์ง ๋ถํฌ์ ์ฌ๋ฌ ๊ณต์๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
p(y) = nCy * p^y * (1-p)^(n-y)
E(x) = n * p
Var(x) = n * p * (1 - p)
STDEV = sqrt(npq)
ํจ๊ป ์์ ๋ฌธ์ ๋ฅผ ํ์ด๋ณผ๊น์?
๊ฐ๋ น ๋น์ ์ด ์ผ์ฑ์ ์ ์ฃผ์์ ๊ตฌ๋งคํ๊ณ , ๋ค์ 5์ผ ์ค 3์ผ๊ฐ ์ฃผ์ ๊ฐ๊ฒฉ์ด ์์นํ ํ๋ฅ ์ ๊ณ์ฐํ๋ ค๊ณ ํฉ๋๋ค.
์ญ์ฌ์ ์ผ๋ก ์ผ์ฑ์ ์ ์ฃผ์์ด 0.6์ ํ๋ฅ ๋ก ์ฃผ์์ด ์์นํ๋ค๊ณ ํ์๋, ํด๋น ํ๋ฅ ์ ์ฐ๋ฆฌ๋ probability function์ ์ฌ์ฉํด์ ๊ตฌํฉ๋๋ค.
์ฌ๊ธฐ์ y=3, n=5, p=0.6์ด ๋๊ฒ ๋ค์.
๊ทธ๋ ๋ค๋ฉด p(3) = 5C3 * 0.6^3 * 0.4^(2) = 10 * 0.216 * 0.16 = 0.3456
์ฆ, 34.56%์ ํ๋ฅ ๋ก ์ผ์ฑ์ ์ ์ฃผ์์ ๋ค์ 5์ผ ์ค 3์ผ๊ฐ ์ฃผ์์ด ์์นํ ๊ฒ ์ ๋๋ค.
'Data Science > ํต๊ณ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Combinations | ์กฐํฉ (0) | 2024.05.19 |
---|---|
Variation (Combinatorics) | ๋ฐ๋ฆฌ์์ด์ (0) | 2024.05.19 |
Permutation and Factorial | ์์ด๊ณผ ํฉํ ๋ฆฌ์ผ (0) | 2024.05.19 |
Complements | ์ฌ์งํฉ (0) | 2024.05.19 |
Frequency | ๋น๋ (0) | 2024.05.19 |