Data Science/통계

Binomial Distribution은 Bernoulli Distribution with mutliple trials로 이해하면 좋습니다.For a random variable X, 이벤트의 결과가 두개의 옵션밖에 존재하지 않는다면, 이를 우리는 베르누이 분포라고 부릅니다.확률 p에 대하여 X~Bern(p)로 표기하고, 이는 X~B(1,p)와 동일합니다. 베르누이 분포에 대해서 조금만 더 알아보자면,E(x) = 1*p + 0*(1-p) = p Variance = p(1-p)STDEV = sqrt(p(1-p))입니다. 관례적으로 우리는 두개의 결과 중 더욱 확률이 높은 결과를 p로, 그렇지 않은 것을 1-p, 혹은 q로 나타냅니다.또한, 우리는 베르누이 분포를 적용하고 싶은 상황에, 각 이벤트에 1과 0..
우리에게 nCr로 더욱 친숙한 조합은, 한 집합에서 특정 요소들을 뽑을 수 있는 가짓수를 칭합니다.여기서 중요한 점은 permutation과는 다르게 순서가 중요하지 않다라는 점 입니다. 예를 들어 학교에서 우리 반의 대표 학생을 3명 뽑는다고 했을 때, 뽑히는 순서는 아무런 상관이 없겠죠? 3명의 학생이 [김준수, 최나영, 박민지] 라고 하면, 이는 [김준수, 박민지, 최나영]을 뽑았을 때나 [박민지, 최나영, 김준수]를 뽑았을 때나 같은 조합입니다. 그렇죠? Combinations 공식 nCr은 다음과 같습니다.nCr = n! / (n-r)! * r!         (중복 허용 X) 우리의 예시에서 우리 반의 총 학생 수를 10명이라고 해봅시다.그렇다면 n = 10, r = 3이 되고, 10C3 = ..
Combinatorics에서 variation은 분산을 뜻하는 것이 아닙니다. Variation이란, 주어진 집합에서 특정 개수의 요소들을 고르고 나열할 수 있는 총 경우의 수를 뜻합니다.정확한 번역을 찾기가 어려워서 그냥 바리에이션이라고 부르겠습니다. 바리에이션 v의 공식은 다음과 같습니다.v = n^p where n = total number of elements, and p = the number of positions. 예를 들어 두개의 0~9까지 입력할 수 있는 숫자 암호를 추측해서 맞춰야 한다고 할 때,n은 0~9까지 총 10개가 가능하니 n = 10, p는 두개의 값을 맞춰야하니 2입니다.즉 v = 10^2 = 100이므로, 해당 이벤트에 대해서 가능한 바리에이션은 총 100개입니다.  이 ..
조합론(Combinatorics)의 중요한 요소 중 하나인 순열(Permutation)은 요소들을 어떻게 나열할 수 있는지를 구하는 것에 집중합니다. 예를 들어 월드컵에서 A, B, C 국가가 1~3등을 차지했다는 정보만 알고 있을 때, 가능한 모든 등수를 구해봅시다.1등2등3등ABCACBBACBCACABCBA총 가능한 경우의 수는 6개로, 그 가능한 가짓수는 3 * 2 * 1 = 3! 이였습니다. n개의 요소들 중에서 r개의 요소를 나열할 때 (혹은 뽑을 때), 가능한 가짓수인 nPr은 다음과 같습니다.nPr = n! / (n-r)!우리의 예시에서 n = 3, r = 3 이였으므로 3P3 = 3! / (3-3)! = 3! / 1 = 3! = 6 이였습니다.(0 팩토리얼은 1입니다)  여기서 다 아시겠지..
Ricky U. Lee
'Data Science/통계' 카테고리의 글 목록