Correlation Analysis(์๊ด ๋ถ์)๊ณผ Regression Analysis(ํ๊ท ๋ถ์)๊ฐ์ ์ฐจ์ด๋ ํ ๋ฌธ์ฅ์ผ๋ก ์ ๋ฆฌํ ์ ์์ต๋๋ค.
"Correlation does not imply causation"
์๊ด ๊ด๊ณ๋ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์๋ฏธํ์ง ์๋๋ค.
๋ ์์ธํ๊ฒ ์ค๋ช ํ์๋ฉด,
1. Correlation์ ๋ ๋ณ์(variable) ์ฌ์ด์ relationship์ ์ ๋๋ฅผ ์ธก์ ํ๋ ๋ฐ๋ฉด, Regression์ ํน์ ๋ณ์๊ฐ ๋ค๋ฅธ ๋ณ์์ ์ด๋ ํ ์ํฅ์ ๋ผ์น๋์ง๋ฅผ ์ธก์ ํฉ๋๋ค.
2. Correlation์ ๋ ๋ณ์ ์ฌ์ด์ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์ธก์ ํ๋๊ฒ์ด ์๋, ๊ด๊ณ์ฑ์ ์ ๋๋ฅผ ์ธก์ ํฉ๋๋ค (move together).
๋ฐ๋ฉด Regression์ ๋ ๋ณ์ ์ฌ์ด์ ์ฐ๊ด์ฑ์ ์ ๋๊ฐ ์๋ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์ง์ ์ธก์ ํฉ๋๋ค (cause and effect).
3. ๋ ๋ณ์ x, y ์ฌ์ด์ correlation์ p(x, y)๋ผ๊ณ ํ ๋, p(x, y) = p(y, x) ์ ๋๋ค. ํ์ง๋ง, regression์ ๊ฒฝ์ฐ์๋ r(x, y)๋ผ๊ณ ํ๋ฉด, ์ผ๋ฐฉํฅ์ ์ํฅ์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์, r(x, y)๊ฐ r(y, x)์ ๋์ผํ์ง ์์ต๋๋ค.
4. ๊ทธ๋ํ๋ก ๋ํ๋ผ ์, correlation ๊ฐ์ ํ ์ ์ผ๋ก ๋ํ๋ด์ง๋ ๋ฐ๋ฉด, regression์ ๊ฒฝ์ฐ์๋ ์ง์ ์ผ๋ก ๋ํ๋ฉ๋๋ค.