์ง๋ ํฌ์คํธ๊น์ง ์ดํด๋ณด์๋ ํ์๋ค, data์ big data์ ์ฒ๋ฆฌ์ business intelligence๋ ๊ณผ๊ฑฐ์ ์ผ์ด๋ ์ผ๋ค์ ๋ถ์ํ๊ธฐ ์ํ ์งํฅ์ ์ ๊ฐ์ง ํ์๋ค์ด์์ต๋๋ค.
์ด๋ฒ ํฌ์คํธ์์๋ ์ด๋ฅผ ํตํด ๊ถ๊ทน์ ์ผ๋ก ์ฐ๋ฆฌ๊ฐ ๋ค๊ฐ๊ฐ๋ ค๊ณ ํ๋ ๋ฏธ๋ ๋ถ์ ์ค, ์ ํต์ ์ธ ๋ฐฉ๋ฒ๋ค์ ๋ํด์ ์๊ฐํ๊ฒ ์ต๋๋ค.
Traditional Methods๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
A set of methods that are derived mainly from statistics and are adopted for business.
Statistic, ์ฆ ์ํ ๋ฐ์ดํฐ์์ ๊ตฌํ ํต๊ณ์ ๊ฐ๋ค์ผ๋ก๋ถํฐ ์ ์ถ๋๊ณ , ๋น์ฆ๋์ค๋ค์ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ๋ค์ ์ด์นญํฉ๋๋ค.
์ด๋ฌํ traditional methods๋ ๋ฏธ๋์ ํผํฌ๋จผ์ค๋ฅผ ์์ธกํ๋๋ฐ ๋์ ์ ํ๋๋ฅผ ๋ณด์ด๋ฉฐ, big data๊ฐ ์๋ traditional data๋ฅผ ๋ถ์ํ ๋์ ๋์ฑ ์ ํฉํฉ๋๋ค.
๋ช๊ฐ์ง ์ ํต์ ๋ฐฉ๋ฒ์ ํ ํฌ๋๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค
Techniques:
1. Linear Regression (์ ํ ํ๊ท): ๋ถ์์ ์ฌ์ฉ๋ ์ฌ๋ฌ ๋ณ์๋ค์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์๋ํ ํ๊ธฐ ์ํ ๋ชจ๋ธ์ ๋๋ค.
์ฃผ๋ก y=bx ์ ํจ์๊ฐ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ๋ฅผ ๊ดํตํ๋ ํํ์ ๋๋ค.
2. Logistic Regression (๋ก์ง์คํฑ ํ๊ท): ํ๊ท ๋ถ์์ธ๋ฐ, y์ถ์ ๊ฐ์ด 0~1๋ก ์ ํ๋๋ ๋ถ์์ ๋๋ค.
์ฃผ๋ก binary decisions, ์ฆ ํ๊ฑฐ๋(1) ํ์ง ์๊ฑฐ๋(0) ๋๊ฐ์ ์ ํ์ง๊ฐ ์๋ ๊ฒฝ์ฐ ํ์ฉ๋ฉ๋๋ค.
3. Cluster Analysis: ๊ฐ๋ค์ ๊ธฐ์ค์ ๋ฐ๋ผ ๋ถ๋ฅํ์ฌ ๋ถ์ํ๋ ๊ณผ์
4. Factor Analysis: ์์ธ ๋ณ์(explanatory variable)๋ค์ ๊ธฐ์ค์ ๋ฐ๋ผ ๋ฌถ์ ํ ๋ถ์ํ๋ ๊ณผ์ ์ ๋๋ค.
์์ธ ๋ณ์ x์ ๋ํ์ฌ, ๋ถ์ ๊ฒฐ๊ณผ y๋ ๋ค์๊ณผ ๊ฐ์ด ํํ๋ฉ๋๋ค.
y = a + b1x1 + b2x2 + b3x3 + ... + bnxn
์ฆ, ์์ธ ๋ณ์ x์ ๊ฐฏ์๊ฐ ๋์ด๋ ์๋ก ๋ชจ๋ธ์ ๋ณต์กํ๊ณ ์ ํ๋๊ฐ ๋ฎ์์ง ์ ์๊ธฐ ๋๋ฌธ์, ๊ฐ์ ์ ์ฌ ๊ฒฝํฅ์ ๊ฐ์ง ์์ธ ๋ณ์๋ค์ ๊ทธ๋ฃนํํ์ฌ ํ๋์ ๋ณ์๋ก ํต์ผํฉ๋๋ค.
์๋ฅผ ๋ค์ด, ์ค๋ฌธ ์กฐ์ฌ๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค๊ณ ๊ฐ์ ํ ๋, '๋๋ฌผ์์ ๋ฐ๋ํฉ๋๊น?', '๋๋ฌผ ์คํ์ ๋ฐ๋ํฉ๋๊น?', '๋๋ฌผ ํ๋ ํ๋์ ๋์ฌ์ผ ํ๋ค๊ณ ์๊ฐํฉ๋๊น' ์ ๊ฐ์ ์ง๋ฌธ๋ค๋ก ์ป์ด์ง๋ ์์ธ ๋ณ์ x1, x2, x3์ ๋์ผํ ๊ฒฝํฅ์ฑ์ ์๊ณ , ์ด๋ฅผ ํ๊ฐ์ง ์ง๋ฌธ์ธ '๋๋ฌผ์ ์ฐํธ์ ์ ๋๊น?'๋ก ํต์ผํ์ฌ ๋ณ์์ ์๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ์ ๋๋ค.
5. Time Series: y์ถ์ ์๊ฐ์ถ์ผ๋ก ๊ณ ์ ํ ํ ๋ฐ์ดํฐ๋ค์ ๋ถ์ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
๊ฐ ๋ฐฉ๋ฒ๋ค์ ์ค์ ํ์ฉ ์์ ๋์ฑ ๊น์ด ์ดํดํ๋๋ก ํ๊ฒ ์ต๋๋ค.
์ง๊ธ์ ๋๋ต์ ์ธ ๊ฐ๋ ๋ง ์ดํดํ๋ ๊ฒ์ผ๋ก ํ๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
์ค์ ์์๋ก๋ ๊ณ ๊ฐ ๋ง์กฑ๋ (User Satisfaction, UX) ๋ถ์์ด ์๊ฒ ์ต๋๋ค.
์ฐ๋ฆฌ์ ๋ชฉ์ ์ ๋น์ฐํ ๊ณ ๊ฐ ๋ง์กฑ๋๋ฅผ ๊ทน๋ํ ํ๋ ๊ฒ์ด๊ฒ ์ฃ ?
์๋ฅผ ๋ค์ด ์ฐ๋ฆฌ์ ํ์ฌ๊ฐ ์ต๊ทผ ์๋ก์ด ์ํ์ ๊ตญ์ ์ ์ผ๋ก ํ๋งคํ๊ธฐ ์์ํ๊ณ , ๋ง์กฑ๋๋ฅผ ์ค๋ฌธํ์ฌ ๊ทธ๋ํ์ ํ์ํ์๋ค๋ฉด, ๋ฌธํ๊ถ์ ๊ณต์ ํ๋ ๋๋ฅ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌ๋ฌ๊ฐ์ง cluster๋ก ๋๋์ด์ ธ ๋ณด์ผ ์ ์์ต๋๋ค.
์ด ๊ฒฝ์ฐ ์์ ๋ฐฉ๋ฒ ์ค ํ๋์ธ Cluster Analysis๋ฅผ ์ ์ฉํ์ฌ, ๋ฌถ์ธ cluster์ ์ ๋งํผ์ ๊ฐ๋ณ์ ํ ์คํธ๋ฅผ ์งํํ๋๋ก ํ ๊ฒ ์ ๋๋ค.
๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ฐ๋ณ์ ๊ฒฐ๊ณผ์ ์ ํฉํ๊ฒ, ๋ค๋ฅธ ๋๋ฅ๋ค์ ๋ค๋ฅธ ๊ฒฝ์ ์ ๋ต์ ํ์ฉํ๋ ๊ฒฐ๋ก ์ ๋์ถํ ์ ์๊ฒ ์ต๋๋ค.