일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- OOP
- 파이썬
- vscode
- 배열
- array
- C++
- 백준
- const
- Object Oriented Programming
- 오블완
- 티스토리챌린지
- pass by reference
- 함수
- programming
- 포인터
- assignment operator
- pointer
- 문자열
- 반복문
- raw data
- baekjoon
- string
- Data Science
- Python
- predictive analysis
- Class
- 알고리즘
- function
- Deep Learning
- Pre-processing
- Today
- Total
Channi Studies
Binomial Distribution | 이항 분포 본문
Binomial Distribution은 Bernoulli Distribution with mutliple trials로 이해하면 좋습니다.
For a random variable X, 이벤트의 결과가 두개의 옵션밖에 존재하지 않는다면, 이를 우리는 베르누이 분포라고 부릅니다.
확률 p에 대하여 X~Bern(p)로 표기하고, 이는 X~B(1,p)와 동일합니다.
베르누이 분포에 대해서 조금만 더 알아보자면,
E(x) = 1*p + 0*(1-p) = p
Variance = p(1-p)
STDEV = sqrt(p(1-p))
입니다.
관례적으로 우리는 두개의 결과 중 더욱 확률이 높은 결과를 p로, 그렇지 않은 것을 1-p, 혹은 q로 나타냅니다.
또한, 우리는 베르누이 분포를 적용하고 싶은 상황에, 각 이벤트에 1과 0을 assign해줘야 할 때가 있습니다.
여기서도 우리는 관례적으로 p의 확률을 가지는 (확률이 더 높은) 결과에 1을, 그리고 반대쪽에 0을 부여합니다.
다시 Binomial Distribution으로 돌아가서,
상기했듯 이항분포는 베르누이 분포의 반복으로 이해하면 직관적입니다.
우리는 이항 분포를 다음과 같이 표시합니다.
X~B(n,p)
이진 분포의 여러 공식들은 다음과 같습니다.
p(y) = nCy * p^y * (1-p)^(n-y)
E(x) = n * p
Var(x) = n * p * (1 - p)
STDEV = sqrt(npq)
함께 예시 문제를 풀어볼까요?
가령 당신이 삼성전자 주식을 구매했고, 다음 5일 중 3일간 주식 가격이 상승할 확률을 계산하려고 합니다.
역사적으로 삼성전자 주식이 0.6의 확률로 주식이 상승한다고 했을때, 해당 확률을 우리는 probability function을 사용해서 구합니다.
여기서 y=3, n=5, p=0.6이 되겠네요.
그렇다면 p(3) = 5C3 * 0.6^3 * 0.4^(2) = 10 * 0.216 * 0.16 = 0.3456
즉, 34.56%의 확률로 삼성전자 주식은 다음 5일 중 3일간 주식이 상승할 것 입니다.
'Data Science > 통계' 카테고리의 다른 글
Combinations | 조합 (0) | 2024.05.19 |
---|---|
Variation (Combinatorics) | 바리에이션 (0) | 2024.05.19 |
Permutation and Factorial | 순열과 팩토리얼 (0) | 2024.05.19 |
Complements | 여집합 (0) | 2024.05.19 |
Frequency | 빈도 (0) | 2024.05.19 |