일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- baekjoon
- Deep Learning
- vscode
- 문자열
- function
- predictive analysis
- Object Oriented Programming
- pass by reference
- 파이썬
- const
- string
- raw data
- 백준
- assignment operator
- 포인터
- pointer
- programming
- OOP
- 함수
- Data Science
- 티스토리챌린지
- C++
- 알고리즘
- Python
- 배열
- array
- 반복문
- Pre-processing
- Class
- 오블완
- Today
- Total
Channi Studies
Expected Values | 예측값 본문
Expected Value란, 우리가 실험을 여러번 반복했을 때, 관측될 결과의 평균으로 예측하는 값 입니다.
여기서 실험(experiment)의 정확한 정의를 알고 가야겠죠?
가령 우리가 동전을 던져서 앞면이 나올 확률인 P(A)를 모른다고 가정해봅시다.
그래서 우리는 코인 토스를 많이 반복해서 나온 결과를 관찰해서, 이 값의 평균을 낼 것 입니다.
한번 던져서 결과를 관측하는, 이 한번의 행위를 우리는 시도(trial)이라고 부릅니다.
그리고 이 시도들이 여러번 반복되는 과정을 실험으로 정의합니다.
예를 들어 우리가 20번 동전을 던져서 관찰한다고 했을 때,
이는 '20번의 개별적인 시도가 있는 1번의 실험' 입니다.
Experimental Probabilities | Theoretical Probabilities
이렇게 실험을 거쳐서 나온 확률값을 우리는 Experimental Probabilities, 실험적 확률 이라고 합니다.
이와 반대되는 개념의 확률은 Theoretical Probabilities, 이론적 확률이라고 부르고, 이 이론적 확률이 실제 확률입니다.
우리가 20번 동전을 던져서 8번 앞면이 나왔다고 이론적으로 모든 동전이 8/20의 확률로 앞면이 나오는건 당연히 아니겠죠?
실제 이론적 확률은 우리가 이미 알다시피 1/2 입니다.
이론적 확률이 1/2라고 해서 100번 던지면 50번 앞면이 나오는것 역시 아니겠죠?
Sample space(n)을 늘리면 늘릴수록, 실험적 확률은 이론적 확률인 0.5에 점점 가까워질 것 입니다.
즉, 이론적 확률은 trial이 무한으로 늘어났을 때 수렴하게 되는 확률 값이라고 이해하면 좋을 것 같습니다.
우리는 주로 이론적 확률을 구할 방법을 모르거나, 너무 복잡할 때, 실험적 확률을 구하려고 합니다.
저번 포스트에서 소개한 이벤트 A가 발생할 확률 P(A)는, 이론적 확률을 소개한 것 입니다.
P(A)
실험적 확률에서의 P(A) = (성공한 시도) / (전체 시도) 입니다.
10000번 던져서 앞면이 4500번 나온 동전 던지기 실험의 확률 P(A) = 4500/10000 이겠네요.
Expected Values
실험에서 A의 값으로 추측하는 값을 우리는 E(A)로 표기합니다. (Expected의 E 입니다)
그리고 E(A) = P(A) * n 입니다. (n = sample space)
우리가 카드 덱에서 20번 무작위로 카드를 뽑아 스페이드를 뽑는 횟수를 측정한다고 해봅시다. (카드를 뽑고 다시 덱에 넣습니다.)
Random variable A = 뽑은 카드, P(A) = 뽑은 카드가 스페이드일 확률 = 1/4, n = 20이므로
E(A) = 1/4 *20 = 5 입니다.
즉, 20번 뽑으면 5번 스페이드 카드를 뽑을 것이라고 추측할 수 있는 것 입니다.
주의할 점은 expected value가 특정 값이라고 해서 실제 실험의 결과 또한 동일하다는 말은 절대 아닙니다.
또 다른 예시를 하나 살펴볼까요?
양궁 경기를 하는데, 표적의 가장 중심인 곳을 A, 중간을 B, 가장 바깥을 C라고 하겠습니다.
각각 영역은 맞추었을 시 100점, 50점, 20점을 줍니다.
그리고 P(A) = 0.1, P(B) = 0.4, P(C) = 0.5일 때, Expected Value는 어떻게 구할까요?
P(X) = P(A) * 100 + P(B) * 0.4 + P(C) * 0.5 = 10 + 20 + 10 = 40이므로
한번의 사격을 통해 얻을 수 있는 점수의 예측값은 40점이라고 할 수 있겠습니다.
정리하자면,
Theoretical Probability에서 P(A) = (desired event) / (total event)이고,
Experimental Probability에서 P(A) = (successful trials) / (total trials)이고,
E(A) = P(A) * n 이라고 정리할 수 있겠습니다.
'Data Science > 통계' 카테고리의 다른 글
Variation (Combinatorics) | 바리에이션 (0) | 2024.05.19 |
---|---|
Permutation and Factorial | 순열과 팩토리얼 (0) | 2024.05.19 |
Complements | 여집합 (0) | 2024.05.19 |
Frequency | 빈도 (0) | 2024.05.19 |
확률(Probability) (0) | 2024.05.19 |