Channi Studies

Expected Values | 예측값 본문

Data Science/통계

Expected Values | 예측값

Chan Lee 2024. 5. 19. 09:15

Expected Value란, 우리가 실험을 여러번 반복했을 때, 관측될 결과의 평균으로 예측하는 값 입니다.

여기서 실험(experiment)의 정확한 정의를 알고 가야겠죠?

 

가령 우리가 동전을 던져서 앞면이 나올 확률인 P(A)를 모른다고 가정해봅시다.

그래서 우리는 코인 토스를 많이 반복해서 나온 결과를 관찰해서, 이 값의 평균을 낼 것 입니다.

한번 던져서 결과를 관측하는, 이 한번의 행위를 우리는 시도(trial)이라고 부릅니다.

그리고 이 시도들이 여러번 반복되는 과정을 실험으로 정의합니다.

 

 

예를 들어 우리가 20번 동전을 던져서 관찰한다고 했을 때,

이는 '20번의 개별적인 시도가 있는 1번의 실험' 입니다.

 

 

Experimental Probabilities | Theoretical Probabilities

이렇게 실험을 거쳐서 나온 확률값을 우리는 Experimental Probabilities, 실험적 확률 이라고 합니다.

이와 반대되는 개념의 확률은 Theoretical Probabilities이론적 확률이라고 부르고, 이 이론적 확률이 실제 확률입니다.

 

우리가 20번 동전을 던져서 8번 앞면이 나왔다고 이론적으로 모든 동전이 8/20의 확률로 앞면이 나오는건 당연히 아니겠죠?

실제 이론적 확률은 우리가 이미 알다시피 1/2 입니다. 

 

이론적 확률이 1/2라고 해서 100번 던지면 50번 앞면이 나오는것 역시 아니겠죠?

Sample space(n)을 늘리면 늘릴수록, 실험적 확률은 이론적 확률인 0.5에 점점 가까워질 것 입니다.

즉, 이론적 확률은 trial이 무한으로 늘어났을 때 수렴하게 되는 확률 값이라고 이해하면 좋을 것 같습니다.

 

 

우리는 주로 이론적 확률을 구할 방법을 모르거나, 너무 복잡할 때, 실험적 확률을 구하려고 합니다.

저번 포스트에서 소개한 이벤트 A가 발생할 확률 P(A)는, 이론적 확률을 소개한 것 입니다.

 

P(A)

실험적 확률에서의 P(A) = (성공한 시도) / (전체 시도) 입니다.

10000번 던져서 앞면이 4500번 나온 동전 던지기 실험의 확률 P(A) = 4500/10000 이겠네요.

 

 

Expected Values

실험에서 A의 값으로 추측하는 값을 우리는 E(A)로 표기합니다. (Expected의 E 입니다)

그리고 E(A) = P(A) * n 입니다. (n = sample space)

 

우리가 카드 덱에서 20번 무작위로 카드를 뽑아 스페이드를 뽑는 횟수를 측정한다고 해봅시다.  (카드를 뽑고 다시 덱에 넣습니다.)

Random variable A = 뽑은 카드, P(A) = 뽑은 카드가 스페이드일 확률 = 1/4, n = 20이므로 

E(A) = 1/4 *20 = 5 입니다.

즉, 20번 뽑으면 5번 스페이드 카드를 뽑을 것이라고 추측할 수 있는 것 입니다.

 

주의할 점은 expected value가 특정 값이라고 해서 실제 실험의 결과 또한 동일하다는 말은 절대 아닙니다.

 

 

또 다른 예시를 하나 살펴볼까요?

양궁 경기를 하는데, 표적의 가장 중심인 곳을 A, 중간을 B, 가장 바깥을 C라고 하겠습니다.

각각 영역은 맞추었을 시 100점, 50점, 20점을 줍니다.

그리고 P(A) = 0.1, P(B) = 0.4, P(C) = 0.5일 때, Expected Value는 어떻게 구할까요?

P(X) = P(A) * 100 + P(B) * 0.4 + P(C) * 0.5 = 10 + 20 + 10 = 40이므로

한번의 사격을 통해 얻을 수 있는 점수의 예측값은 40점이라고 할 수 있겠습니다.

 

 

 

정리하자면, 

Theoretical Probability에서 P(A) = (desired event) / (total event)이고,

Experimental Probability에서 P(A) = (successful trials) / (total trials)이고,

E(A) = P(A) * n 이라고 정리할 수 있겠습니다.

'Data Science > 통계' 카테고리의 다른 글

Variation (Combinatorics) | 바리에이션  (0) 2024.05.19
Permutation and Factorial | 순열과 팩토리얼  (0) 2024.05.19
Complements | 여집합  (0) 2024.05.19
Frequency | 빈도  (0) 2024.05.19
확률(Probability)  (0) 2024.05.19