Expected Value๋, ์ฐ๋ฆฌ๊ฐ ์คํ์ ์ฌ๋ฌ๋ฒ ๋ฐ๋ณตํ์ ๋, ๊ด์ธก๋ ๊ฒฐ๊ณผ์ ํ๊ท ์ผ๋ก ์์ธกํ๋ ๊ฐ ์ ๋๋ค.
์ฌ๊ธฐ์ ์คํ(experiment)์ ์ ํํ ์ ์๋ฅผ ์๊ณ ๊ฐ์ผ๊ฒ ์ฃ ?
๊ฐ๋ น ์ฐ๋ฆฌ๊ฐ ๋์ ์ ๋์ ธ์ ์๋ฉด์ด ๋์ฌ ํ๋ฅ ์ธ P(A)๋ฅผ ๋ชจ๋ฅธ๋ค๊ณ ๊ฐ์ ํด๋ด ์๋ค.
๊ทธ๋์ ์ฐ๋ฆฌ๋ ์ฝ์ธ ํ ์ค๋ฅผ ๋ง์ด ๋ฐ๋ณตํด์ ๋์จ ๊ฒฐ๊ณผ๋ฅผ ๊ด์ฐฐํด์, ์ด ๊ฐ์ ํ๊ท ์ ๋ผ ๊ฒ ์ ๋๋ค.
ํ๋ฒ ๋์ ธ์ ๊ฒฐ๊ณผ๋ฅผ ๊ด์ธกํ๋, ์ด ํ๋ฒ์ ํ์๋ฅผ ์ฐ๋ฆฌ๋ ์๋(trial)์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
๊ทธ๋ฆฌ๊ณ ์ด ์๋๋ค์ด ์ฌ๋ฌ๋ฒ ๋ฐ๋ณต๋๋ ๊ณผ์ ์ ์คํ์ผ๋ก ์ ์ํฉ๋๋ค.
์๋ฅผ ๋ค์ด ์ฐ๋ฆฌ๊ฐ 20๋ฒ ๋์ ์ ๋์ ธ์ ๊ด์ฐฐํ๋ค๊ณ ํ์ ๋,
์ด๋ '20๋ฒ์ ๊ฐ๋ณ์ ์ธ ์๋๊ฐ ์๋ 1๋ฒ์ ์คํ' ์ ๋๋ค.
Experimental Probabilities | Theoretical Probabilities
์ด๋ ๊ฒ ์คํ์ ๊ฑฐ์ณ์ ๋์จ ํ๋ฅ ๊ฐ์ ์ฐ๋ฆฌ๋ Experimental Probabilities, ์คํ์ ํ๋ฅ ์ด๋ผ๊ณ ํฉ๋๋ค.
์ด์ ๋ฐ๋๋๋ ๊ฐ๋ ์ ํ๋ฅ ์ Theoretical Probabilities, ์ด๋ก ์ ํ๋ฅ ์ด๋ผ๊ณ ๋ถ๋ฅด๊ณ , ์ด ์ด๋ก ์ ํ๋ฅ ์ด ์ค์ ํ๋ฅ ์ ๋๋ค.
์ฐ๋ฆฌ๊ฐ 20๋ฒ ๋์ ์ ๋์ ธ์ 8๋ฒ ์๋ฉด์ด ๋์๋ค๊ณ ์ด๋ก ์ ์ผ๋ก ๋ชจ๋ ๋์ ์ด 8/20์ ํ๋ฅ ๋ก ์๋ฉด์ด ๋์ค๋๊ฑด ๋น์ฐํ ์๋๊ฒ ์ฃ ?
์ค์ ์ด๋ก ์ ํ๋ฅ ์ ์ฐ๋ฆฌ๊ฐ ์ด๋ฏธ ์๋ค์ํผ 1/2 ์ ๋๋ค.
์ด๋ก ์ ํ๋ฅ ์ด 1/2๋ผ๊ณ ํด์ 100๋ฒ ๋์ง๋ฉด 50๋ฒ ์๋ฉด์ด ๋์ค๋๊ฒ ์ญ์ ์๋๊ฒ ์ฃ ?
Sample space(n)์ ๋๋ฆฌ๋ฉด ๋๋ฆด์๋ก, ์คํ์ ํ๋ฅ ์ ์ด๋ก ์ ํ๋ฅ ์ธ 0.5์ ์ ์ ๊ฐ๊น์์ง ๊ฒ ์ ๋๋ค.
์ฆ, ์ด๋ก ์ ํ๋ฅ ์ trial์ด ๋ฌดํ์ผ๋ก ๋์ด๋ฌ์ ๋ ์๋ ดํ๊ฒ ๋๋ ํ๋ฅ ๊ฐ์ด๋ผ๊ณ ์ดํดํ๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
์ฐ๋ฆฌ๋ ์ฃผ๋ก ์ด๋ก ์ ํ๋ฅ ์ ๊ตฌํ ๋ฐฉ๋ฒ์ ๋ชจ๋ฅด๊ฑฐ๋, ๋๋ฌด ๋ณต์กํ ๋, ์คํ์ ํ๋ฅ ์ ๊ตฌํ๋ ค๊ณ ํฉ๋๋ค.
์ ๋ฒ ํฌ์คํธ์์ ์๊ฐํ ์ด๋ฒคํธ A๊ฐ ๋ฐ์ํ ํ๋ฅ P(A)๋, ์ด๋ก ์ ํ๋ฅ ์ ์๊ฐํ ๊ฒ ์ ๋๋ค.
P(A)
์คํ์ ํ๋ฅ ์์์ P(A) = (์ฑ๊ณตํ ์๋) / (์ ์ฒด ์๋) ์ ๋๋ค.
10000๋ฒ ๋์ ธ์ ์๋ฉด์ด 4500๋ฒ ๋์จ ๋์ ๋์ง๊ธฐ ์คํ์ ํ๋ฅ P(A) = 4500/10000 ์ด๊ฒ ๋ค์.
Expected Values
์คํ์์ A์ ๊ฐ์ผ๋ก ์ถ์ธกํ๋ ๊ฐ์ ์ฐ๋ฆฌ๋ E(A)๋ก ํ๊ธฐํฉ๋๋ค. (Expected์ E ์ ๋๋ค)
๊ทธ๋ฆฌ๊ณ E(A) = P(A) * n ์ ๋๋ค. (n = sample space)
์ฐ๋ฆฌ๊ฐ ์นด๋ ๋ฑ์์ 20๋ฒ ๋ฌด์์๋ก ์นด๋๋ฅผ ๋ฝ์ ์คํ์ด๋๋ฅผ ๋ฝ๋ ํ์๋ฅผ ์ธก์ ํ๋ค๊ณ ํด๋ด ์๋ค. (์นด๋๋ฅผ ๋ฝ๊ณ ๋ค์ ๋ฑ์ ๋ฃ์ต๋๋ค.)
Random variable A = ๋ฝ์ ์นด๋, P(A) = ๋ฝ์ ์นด๋๊ฐ ์คํ์ด๋์ผ ํ๋ฅ = 1/4, n = 20์ด๋ฏ๋ก
E(A) = 1/4 *20 = 5 ์ ๋๋ค.
์ฆ, 20๋ฒ ๋ฝ์ผ๋ฉด 5๋ฒ ์คํ์ด๋ ์นด๋๋ฅผ ๋ฝ์ ๊ฒ์ด๋ผ๊ณ ์ถ์ธกํ ์ ์๋ ๊ฒ ์ ๋๋ค.
์ฃผ์ํ ์ ์ expected value๊ฐ ํน์ ๊ฐ์ด๋ผ๊ณ ํด์ ์ค์ ์คํ์ ๊ฒฐ๊ณผ ๋ํ ๋์ผํ๋ค๋ ๋ง์ ์ ๋ ์๋๋๋ค.
๋ ๋ค๋ฅธ ์์๋ฅผ ํ๋ ์ดํด๋ณผ๊น์?
์๊ถ ๊ฒฝ๊ธฐ๋ฅผ ํ๋๋ฐ, ํ์ ์ ๊ฐ์ฅ ์ค์ฌ์ธ ๊ณณ์ A, ์ค๊ฐ์ B, ๊ฐ์ฅ ๋ฐ๊นฅ์ C๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
๊ฐ๊ฐ ์์ญ์ ๋ง์ถ์์ ์ 100์ , 50์ , 20์ ์ ์ค๋๋ค.
๊ทธ๋ฆฌ๊ณ P(A) = 0.1, P(B) = 0.4, P(C) = 0.5์ผ ๋, Expected Value๋ ์ด๋ป๊ฒ ๊ตฌํ ๊น์?
P(X) = P(A) * 100 + P(B) * 0.4 + P(C) * 0.5 = 10 + 20 + 10 = 40์ด๋ฏ๋ก
ํ๋ฒ์ ์ฌ๊ฒฉ์ ํตํด ์ป์ ์ ์๋ ์ ์์ ์์ธก๊ฐ์ 40์ ์ด๋ผ๊ณ ํ ์ ์๊ฒ ์ต๋๋ค.
์ ๋ฆฌํ์๋ฉด,
Theoretical Probability์์ P(A) = (desired event) / (total event)์ด๊ณ ,
Experimental Probability์์ P(A) = (successful trials) / (total trials)์ด๊ณ ,
E(A) = P(A) * n ์ด๋ผ๊ณ ์ ๋ฆฌํ ์ ์๊ฒ ์ต๋๋ค.
'Data Science > ํต๊ณ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Variation (Combinatorics) | ๋ฐ๋ฆฌ์์ด์ (0) | 2024.05.19 |
---|---|
Permutation and Factorial | ์์ด๊ณผ ํฉํ ๋ฆฌ์ผ (0) | 2024.05.19 |
Complements | ์ฌ์งํฉ (0) | 2024.05.19 |
Frequency | ๋น๋ (0) | 2024.05.19 |
ํ๋ฅ (Probability) (0) | 2024.05.19 |