์ ๋ฒ ํฌ์คํธ์์๋ ์ ํ ํ๊ท ๋ชจ๋ธ์ ๋์์ธ ํ๋ ๊ณผ์ ์์ StatsModels ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ์ป์ ์ ์๋ Coefficient Table์ ๋ํด์ ์์๋ณด์์ต๋๋ค.
์ด๋ฒ ํฌ์คํธ์์๋ ์ฐ๋ฆฌ๊ฐ ๋ง๋ ์ ํ ํ๊ท ๋ชจ๋ธ์ ๋ถ์ฐ์ ํ๊ฐํ๋ ๋ช๊ฐ์ง ๋ฐฉ๋ฒ์ ๊ฐ๋ณ๊ฒ ์์๋ณด๊ฒ ์ต๋๋ค.
์ฐ๋ฆฌ์ ํ๊ท ๋ชจ๋ธ yฬ = b0 + b1*x1 ์ ์์๋ณด๊ธฐ ์ด์ ์ 3๊ฐ์ ์ฉ์ด๋ฅผ ์์๋ณด๊ฒ ์ต๋๋ค.
1. Sum of Squares Total (SST)
Sum of Squares Total ์ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค.
๊ฐ xi์ ๋ํ yi๊ฐ(์ค์ ๊ฐ)์์ y๊ฐ๋ค์ ํ๊ท ์ ๋บ ๊ฒ์ ์ ๊ณฑํ์ฌ ๋ชจ๋ ๋ํ ๊ฐ ์ ๋๋ค.
๋ถ์ฐ์ ๊ฐ๋ ๊ณผ ๋งค์ฐ ์ ์ฌํ์ฃ ? ์ ํํฉ๋๋ค. SST๋ ๋ฐ์ดํฐ์ ์ด ๋ถ์ฐ์ ์ธก์ ํฉ๋๋ค.๊ฐ๋ TSS, Total Sum of Squares๋ก ํ๊ธฐํ๋ ๊ฒฝ์ฐ๋ ์์ต๋๋ค.
2. Sum of Squares Regression (SSR)
Sum of Squares Regression์ SST๋ฅผ ์ฐ๋ฆฌ ๋ชจ๋ธ์ ์ ์ฉํ๋ค๊ณ ์๊ฐํ๋ฉด ์ฝ์ต๋๋ค.
yฬi(xi์ ๋ํ ํ๊ท์ง์ ์ ์์ธก๊ฐ) ์์ y์ ํ๊ท ์ ๋บ ๊ฒ์ ์ ๊ณฑํ์ฌ ๋ชจ๋ ๋ํ ๊ฐ ์ ๋๋ค.
์ด ๊ฐ์ ์ฐ๋ฆฌ์ ํ๊ท ์ง์ ์ด ์ผ๋ง๋ ๋ฐ์ดํฐ์ ์ ํฉํ๊ฒ ๋์์ธ ๋์๋์ง๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋ง์ฝ SSR์ด SST์ ๋์ผํ๋ค๋ฉด, ์ฐ๋ฆฌ์ ๋ชจ๋ธ์ด ๋ชจ๋ ๊ด์ธก๋ ๋ถ์ฐ์ ์๋ฒฝํ๊ณ ์ ํํ๊ฒ ๋ํ๋ด๊ณ ์๋ค๊ณ ์ดํดํ ์ ์๊ฒ ์ต๋๋ค.
๋ค์ ๋งํด ๋ชจ๋ธ์ด ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์๋ฒฝํ๊ฒ ์์ธกํ๊ณ ์๋ค๋ ๋ป์ผ๋ก, ํ์ค์์๋ ์ฌ์ค์ ๋ถ๊ฐ๋ฅํฉ๋๋ค.
๊ฐ๊น์ฐ๋ฉด ๊ฐ๊น์ธ ์๋ก ์ข๋ค๊ณ ์ดํดํ๋ฉด ๋๊ฒ ์ฃ ?
SSR ์ญ์ ESS, Explained Sum of Squares๋ก ํ๊ธฐํ๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค.
3. Sum of Squares Error (SSE)
๋ง์ง๋ง์ผ๋ก ์์๋ณผ SSE๋ ์ค์ฐจ์ ์ ๊ณฑ์ ํฉ ์ ๋๋ค.
์ ํ ํ๊ท ์ง์ ์ ๋ํ์ฌ ์ค์ ๊ฐ์์ ์์ธก ๊ฐ์ ์ฐจ์ด๋ฅผ ei๋ผ๊ณ ํ๊ณ , ์ด ๊ฐ์ ์ ๊ณฑ์ ๋ชจ๋ ๋ํ ๊ฐ ์ ๋๋ค.
์ด๋ ๋ํ unexplained variability, ์ค๋ช ํ์ง ๋ชปํ ๋ถ์ฐ์ ๊ฐ์ผ๋ก ์ดํดํ ์ ์์ต๋๋ค.
๋น์ฐํ๊ฒ๋ ์ด ๊ฐ์ ํด์๋ก ์ค์ฐจ๊ฐ ํฌ๋ค๋ ๋ป์ด๋๊น, ์์ผ๋ฉด ์์์๋ก ์ข๊ฒ ์ฃ ?
SSE ์ญ์ RSS, Residual Sum of Squares๋ก ๋ถ๋ฅด๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค.
์ ๊ทธ๋ํ๋ค์์ ๋ณผ ์ ์๋ฏ, SST = SSR + SSE, ์ฆ
Total Variability = Explained Variability + Unexplained Variability์ ๊ด๊ณ๊ฐ ์กด์ฌํฉ๋๋ค.
ํน์ SST๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ ๋ฎ์ SSE, ์ฆ ๋ ๋ฎ์ ์ค๋ช ํ์ง ๋ชปํ ๋ถ์ฐ, ๋ค์ ๋งํด ๋ ๋ฎ์ ์๋ฌ๋ ๋ ๋์ SSR, ์ฆ ๋ ๋์ ์ ํ๋๋ก ๊ท๊ฒฐ๋ฉ๋๋ค.
๋ค์ ํฌ์คํธ์์๋ ์ ๋ฒ ํฌ์คํธ์์ ์ดํด๋ณธ ํ์์ ์์ง ์์๋ณด์ง ๋ชปํ ๋ถ๋ถ๋ค์ ๋ค์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.