Correlation Analysis(상관 분석)과 Regression Analysis(회귀 분석)간의 차이는 한 문장으로 정리할 수 있습니다.
"Correlation does not imply causation"
상관 관계는 인과 관계를 의미하지 않는다.
더 자세하게 설명하자면,
1. Correlation은 두 변수(variable) 사이의 relationship의 정도를 측정하는 반면, Regression은 특정 변수가 다른 변수에 어떠한 영향을 끼치는지를 측정합니다.
2. Correlation은 두 변수 사이의 인과 관계를 측정하는것이 아닌, 관계성의 정도를 측정합니다 (move together).
반면 Regression은 두 변수 사이의 연관성의 정도가 아닌 인과 관계를 직접 측정합니다 (cause and effect).
3. 두 변수 x, y 사이의 correlation을 p(x, y)라고 할 때, p(x, y) = p(y, x) 입니다. 하지만, regression의 경우에는 r(x, y)라고 하면, 일방향의 영향이 존재하기 때문에, r(x, y)가 r(y, x)와 동일하지 않습니다.
4. 그래프로 나타낼 시, correlation 값은 한 점으로 나타내지는 반면, regression의 경우에는 직선으로 나타납니다.