Channi Studies

Binomial Distribution | 이항 분포 본문

Data Science/통계

Binomial Distribution | 이항 분포

Chan Lee 2024. 5. 22. 01:26

Binomial Distribution은 Bernoulli Distribution with mutliple trials로 이해하면 좋습니다.

For a random variable X, 이벤트의 결과가 두개의 옵션밖에 존재하지 않는다면, 이를 우리는 베르누이 분포라고 부릅니다.

확률 p에 대하여 X~Bern(p)로 표기하고, 이는 X~B(1,p)와 동일합니다.

 

베르누이 분포에 대해서 조금만 더 알아보자면,

E(x) = 1*p + 0*(1-p) = p 

Variance = p(1-p)

STDEV = sqrt(p(1-p))

입니다.

 

관례적으로 우리는 두개의 결과 중 더욱 확률이 높은 결과를 p로, 그렇지 않은 것을 1-p, 혹은 q로 나타냅니다.

또한, 우리는 베르누이 분포를 적용하고 싶은 상황에, 각 이벤트에 10을 assign해줘야 할 때가 있습니다. 

여기서도 우리는 관례적으로 p의 확률을 가지는 (확률이 더 높은) 결과에 1을, 그리고 반대쪽에 0을 부여합니다.

 

 

다시 Binomial Distribution으로 돌아가서, 

상기했듯 이항분포는 베르누이 분포의 반복으로 이해하면 직관적입니다.

우리는 이항 분포를 다음과 같이 표시합니다. 

X~B(n,p) 

 

이진 분포의 여러 공식들은 다음과 같습니다.

p(y) = nCy * p^y * (1-p)^(n-y)

E(x) = n * p

Var(x) = n * p * (1 - p)

STDEV = sqrt(npq)

 

함께 예시 문제를 풀어볼까요?

가령 당신이 삼성전자 주식을 구매했고, 다음 5일 중 3일간 주식 가격이 상승할 확률을 계산하려고 합니다.

역사적으로 삼성전자 주식이 0.6의 확률로 주식이 상승한다고 했을때, 해당 확률을 우리는 probability function을 사용해서 구합니다.

 

여기서 y=3, n=5, p=0.6이 되겠네요.

그렇다면 p(3) = 5C3 * 0.6^3 * 0.4^(2) = 10 * 0.216 * 0.16 = 0.3456

즉, 34.56%의 확률로 삼성전자 주식은 다음 5일 중 3일간 주식이 상승할 것 입니다.

'Data Science > 통계' 카테고리의 다른 글

Combinations | 조합  (0) 2024.05.19
Variation (Combinatorics) | 바리에이션  (0) 2024.05.19
Permutation and Factorial | 순열과 팩토리얼  (0) 2024.05.19
Complements | 여집합  (0) 2024.05.19
Frequency | 빈도  (0) 2024.05.19