Channi Studies

Correlation Analysis vs Regression Analysis | 상관 분석 vs 회귀 분석 본문

Data Science/개념과 용어

Correlation Analysis vs Regression Analysis | 상관 분석 vs 회귀 분석

Chan Lee 2024. 6. 2. 14:21

Correlation Analysis(상관 분석)과  Regression Analysis(회귀 분석)간의 차이는 한 문장으로 정리할 수 있습니다.

 

"Correlation does not imply causation"

상관 관계는 인과 관계를 의미하지 않는다.

 

더 자세하게 설명하자면,

1. Correlation은 두 변수(variable) 사이의 relationship의 정도를 측정하는 반면, Regression은 특정 변수가 다른 변수에 어떠한 영향을 끼치는지를 측정합니다.

2. Correlation은 두 변수 사이의 인과 관계를 측정하는것이 아닌, 관계성의 정도를 측정합니다 (move together).
반면 Regression은 두 변수 사이의 연관성의 정도가 아닌 인과 관계를 직접 측정합니다 (cause and effect).

3. 두 변수 x, y 사이의 correlation을 p(x, y)라고 할 때, p(x, y) = p(y, x) 입니다. 하지만, regression의 경우에는 r(x, y)라고 하면, 일방향의 영향이 존재하기 때문에, r(x, y)가 r(y, x)와 동일하지 않습니다.

4. 그래프로 나타낼 시, correlation 값은 한 점으로 나타내지는 반면, regression의 경우에는 직선으로 나타납니다.