A/B testing is a type of experiment in Data Science that compare values of sampled individuals in Group A with values of sampled individuals in Group B.
Q. Do the two sets of values come from the same underlying distribution?
์๋ฅผ ๋ค์ด, ๋ํ๋ฏผ๊ตญ์ A ์ง์ญ์์ ์ํ๋ง์ ํตํด ์ธก์ ํ ํ๊ท ์ ์ฅ์ด 165cm, B ์ง์ญ์์๋ 170cm๋ผ๊ณ ํด๋ณด๊ฒ ์ต๋๋ค. (observed statistic)
์ฌ๊ธฐ์, A์ B ์ง์ญ์ ํ๊ท ์ ์ฅ ์ฐจ์ด๊ฐ same underlying distribution (๋ํ๋ฏผ๊ตญ ์ ์ฒด ์ ์ฅ ๋ถํฌ) ์์ ๋น๋กฏ๋ ๊ฒ์ผ๋ก ํ๋จ์ด ๋๋์ง๋ฅผ ๊ณ ๋ คํ ์ ์์ต๋๋ค.
If the result is not statistically significant (i.e. less than p-value cutoff), then we reject the null hypothesis that the average height of A is equal to B.
์ฆ, A์ B์์ ๊ด์ธก๋ ํ๊ท ์ ์ฅ์ ์ฐจ์ด๊ฐ ํ๋ฅ ์ ์ผ๋ก ๊ด์ธก๋ ์ ์๋์ง (์ฐ์ฐ์ผ๋ก ๊ด์ธก๋ ๊ฒ์ธ์ง), ์๋๋ฉด ์ฌ์ค์ ํ๋ฅ ์ ์ผ๋ก ๋ถ๊ฐ๋ฅํ์ง (p-value ๊ฐ cutoff๋ณด๋ค ๋ฎ์์ง) ๋ฅผ ํ๋จํ ์ ์์ต๋๋ค.
Sometimes, random permutation technique is applied on A/B testing.
์ฐ๋ฆฌ๋ Categorical Value์ ์ฐจ์ด๊ฐ ์ํ๋ test statistic์ ์ํฅ์ ์ฃผ๋์ง๋ฅผ ํ์ธํ๊ณ ์ถ์ ๋๊ฐ ์์ต๋๋ค.
์๋ฅผ ๋ค์ด, ์์ ๊ธฐ๊ฐ ์ค ์ด๋จธ๋์ ํก์ฐ ์ฌ๋ถ์ ๋ฐ๋ฅธ ์ ์์์ ์ ์ฅ ์ฐจ์ด๋ฅผ ํ์ธํ๋ ค๊ณ ํ๋ ์ํฉ์ ์๊ฐํด๋ด ์๋ค.
ํก์ฐ ์ฌ๋ถ (True or False) ์ ๋ฐ๋ฅธ ์ ์ฅ์ ํ๊ท ์ ๊ตฌํ๊ณ , ๋ ๊ฐ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ์ฌ ์ด๋ฅผ test statistic์ผ๋ก ์ผ๊ฒ ์ต๋๋ค.
๋ง์ฝ, ํก์ฐ ์ฌ๋ถ๊ฐ ์ ์์์ ์ ์ฅ์ ์ํฅ์ด ์๋ค๋ฉด, ํก์ฐ ์ฌ๋ถ๋ ์ ์์์ ์ ์ฅ์ ์ํฅ์ ์ฃผ๋ ์์๊ฐ ์๋๊ธฐ ๋๋ฌธ์ True์ธ ์ง๋จ๊ณผ Falsed์ธ ์ง๋จ์ ํ๊ท ์ ์ฅ ๋ถํฌ์ ์ ์๋ฏธํ ์ฐจ์ด๊ฐ ์กด์ฌํ๋ฉด ์๋ฉ๋๋ค.
์ด๋ด ๋, ์ฐ๋ฆฌ๋ categorical label, ์ด ๊ฒฝ์ฐ์๋ ํก์ฐ ์ฌ๋ถ์ ํด๋นํ๋ ๊ฐ๋ค์ ๋๋คํ๊ฒ ์์ด์ค๋๋ค (without replacement)
์ด๋ฅผ ์ฐ๋ฆฌ๊ฐ random permutation ์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
์ด์ฐจํผ ํด๋น ๋ ์ด๋ธ์ ์ํฅ์ด ์กด์ฌํ์ง ์๊ธฐ ๋๋ฌธ์, permutation์ ํ๋ ์ํ๋ test statistic์ ๋์ผ (์ ์ฌ)ํ๊ฒ ์ธก์ ๋์ด์ผ ํ๊ฒ ์ฃ ?
์ฆ, random permutation์ ๋คํ ๋ฐ๋ณตํ์ฌ ์ธก์ ๋ distribution์์ ์ด๊ธฐ observed statistic์ ๊ฐ์ p-value๋ฅผ ํ์ธํจ์ผ๋ก์จ statistical signifcance์ ๋ํ ํ๋จ์ ๋ด๋ฆด ์ ์๊ฒ ์ต๋๋ค.
๋ ์์ธํ ๋ด์ฉ์ UC Berkeley Data 8 Course์ ๋ฌด๋ฃ ์ ๊ณต๋๋ ์ธํฐ๋ท ์๋ฃ์์ ์ฐพ์๋ณผ ์ ์์ต๋๋ค.
https://inferentialthinking.com/chapters/12/1/AB_Testing.html
'Data Science > ๊ฐ๋ ๊ณผ ์ฉ์ด' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Trend, Pattern, and The Correlation Coefficient (r) (1) | 2024.11.15 |
---|---|
How to Interpret Confidence Interval | ์ ๋ขฐ ๊ตฌ๊ฐ์ ํด์ (2) | 2024.11.01 |
The Bootstrap Technique | ๋ถํธ์คํธ๋ฉ (2) | 2024.10.23 |
What is Data Science? (1) | 2024.09.09 |
Linear Regression (์ ํ ํ๊ท) - 8 | Assumptions (์ ํ ํ๊ท ๊ฐ์ ) (1) | 2024.06.12 |