Machine Learning (ML) ์ ๋ฌด์์ผ๊น์?
๋จธ์ ๋ฌ๋์ ์ปดํจํฐ์๊ฒ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ์ ๊ฐ์ฅ ์ ํ์ฉ๋ ์ ์๋ ๋ถ์ ๋ชจ๋ธ์ ์ฐพ์ ์ ์๋๋ก ํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํด์ฃผ๊ณ , ์ปดํจํฐ์ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋งค์ฐ ์ ํํ ์์ธก์ ํ ์ ์๋ ์ผ๋ จ์ ๊ณผ์ ์ ๋งํฉ๋๋ค.
์ง๋ ํฌ์คํธ์์ ์ดํด๋ณธ ์ ํต์ ๋ฐฉ๋ฒ๋ค๊ณผ๋ ๋ค๋ฅด๊ฒ, ์ฐ๋ฆฌ๋ ์ปดํจํฐ์๊ฒ ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ ๋ณด๋ ์ฃผ์ง ์์ต๋๋ค.
(์ฐ๋ฆฌ๋ ๋ชจ๋ฅด๋๊น์)
์ฐ๋ฆฌ๊ฐ ์ปดํจํฐ์๊ฒ ์ฃผ๋ ๊ฒ์ ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค.
์ปดํจํฐ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ๋ชจ๋ธ์ ๋ฐ์ ์ํต๋๋ค.
์ต์ ์ ๋ชจ๋ธ์ ์ฐพ๋ ํ์๋ ์ปดํจํฐ์ ๋ชซ์ ๋๋ค.
์ฌ๊ธฐ์ '์ต์ '์ ๊ธฐ์ค์ ์ด๋ป๊ฒ ์ ํ๋์ ๋ฐ๋ผ์ ํ์ต ๋ฐ๋ณต์ ํ์๊ฐ ๋ณํ๊ฒ ์ฃ ?
๋จธ์ ๋ฌ๋์ ๊ณผ์ ์ ์ฝ๊ฒ ์์ฝํ๋ฉด, Trial-and-Error ๊ณผ์ , ์ฆ ์๋์ ์๋ฌ์ ๊ณผ์ ์ ๋๋ค.
๊ฐ ์ฐ์์ ์ธ ์๋(ํ์ต)๋ '๋ฌด์กฐ๊ฑด' ์ง๋ ์๋(ํ์ต)๊ณผ ๋์ผํ๊ฑฐ๋ ๋์ฑ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๊ฒ ๋ฉ๋๋ค.
์ด๋ฌํ ๋จธ์ ๋ฌ๋์๋ ํฌ๊ฒ 4๊ฐ์ง์ ํ์ ๊ตฌ์ฑ ์์๊ฐ ์กด์ฌํฉ๋๋ค.
1. ๋ฐ์ดํฐ
2. ๋ชจ๋ธ
3. Objective Function (๋ชฉ์ ํจ์)
4. Optimization Algorithm (์ต์ ํ ์๊ณ ๋ฆฌ์ฆ)
์ ๋๋ค.
์ปดํจํฐ์ ๋ชจ๋ธ์ด ์ ๊ณต๋ ๋ฐ์ดํฐ์ ๋ชฉ์ ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๊ณ , ํ๊ฐ๋ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ ๊ฑฐ์ณ ๋์ฑ ๋์ ๋ชจ๋ธ์ deriveํ๋ ๊ณผ์ ์ ๋ฐ๋ณต์ ๋จธ์ ๋ฌ๋์ด๋ผ๊ณ ํ ์ ์๊ฒ ์ต๋๋ค.
์์๋ฅผ ๋ค์ด๋ณผ๊น์?
๋ก๋ด์๊ฒ ํ๊ณผ ์ฌ๋ฌ ์ข ๋ฅ์ ํ์ด๋ค์ ์ ๊ณตํ ๋ค, ํ์ ์ ์ค์์ ๊ฐ์ฅ ์ ๋ง์ถ ์ ์๋๋ก ๋จธ์ ๋ฌ๋์ ์์ผฐ๋ค๊ณ ํฉ์๋ค.
์ฌ๊ธฐ์ ๋ฐ์ดํฐ๋ ์ฌ๋ฌ ์ข ๋ฅ์ ํ์ด์ด ๋ ๊ฒ์ด๊ณ , ๋ชจ๋ธ์ ์ปดํจํฐ๊ฐ ์ ์ฉํ๋ ํ์ด์ ์๋ ๋ฐฉ๋ฒ์ด ๋๊ฒ ์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ ๋ชฉ์ ํจ์๋ ํ๊ท ์ ์ธ ํ์ ์ค์์์์ ํ์ด ๊ฑฐ๋ฆฌ๋ผ๊ณ ๋ณด๊ณ , ์ด๊ฒ 0์ ๊ฐ๊น์ธ ์๋ก ์ข์ ๊ฒ์ด๊ฒ ์ฃ ?
๊ทธ๋ ๋ค๋ฉด ๊ฐ ํ์ต์ ํตํด ์ฌ๋ฌ๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ํ์ ์๋ ๊ฒ์ ์๋ง์ด ๋ฐ๋ณตํ ๊ธฐ๊ณ๊ฐ, ๊ฐ trial ์ดํ์ ๋ชฉ์ ํจ์์ ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก ๋ชจ๋ธ์ ํ๊ฐํ์ฌ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์๋ง์ด ์ ์ฉํ๊ฒ ๋๊ณ , ์กฐ๊ธ์ฉ ๋ ๋์ ๋ชจ๋ธ์ ๋ง๋ค ์ ์๊ฒ ๋๋ ๊ฒ ์ ๋๋ค.
์ฌ๊ธฐ์ ์ฃผ๋ชฉํ ์ ์ ์ฐ๋ฆฌ๊ฐ ๋ชฉ์ ์ ์ ์ํด ์ฃผ์์ ๋ฟ, ์ฐ๋ฆฌ๋ ํ์ ๊ฐ์ฅ ์ ์๋ ์ต์ ์ ๋ฐฉ๋ฒ์ ๋ชจ๋ฅธ๋ค๋ ๊ฒ ์ ๋๋ค.
ํน์ ๊ธฐ๊ณ๊ฐ ์ฐ๋ฆฌ๊ฐ ์ธ๋ฅ ์ญ์ฌ๋์ ํ๋ฒ๋ ์ฌ์ฉํ์ง ์์๋ ์์ฒญ๋ ๋ฐฉ๋ฒ์ ์๊ฒ ๋ ์๋ ์๋ค๋ ์ ์ ์ธ์งํด์ผ ํฉ๋๋ค.
์ด๋ฌํ ๋จธ์ ๋ฌ๋์ ์ข ๋ฅ๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
Types of Machine Learning:
1. Supervised Learning (์ง๋ ํ์ต)
์๊ณ ๋ฆฌ์ฆ ํ์ต์ ๊ณผ์ ์ด ์ ์์ด ํ์์ ์ง๋ํ์ต ํ๋ ๊ณผ์ ๊ณผ ๋ฎ์ ์๋ค๊ณ ํ์ฌ ๋ถ์ ์ด๋ฆ์ ๋๋ค.
์์ ํ์๊ธฐ ๋ชจ๋ธ ์์๊ฐ ๋ฐ๋ก ์ด ์ง๋ ํ์ต์ ์์์ ๋๋ค.
์ค์ ์ ๋ ๊ฐ์์ง๊ธฐ ์ํด์, ์ฐ๋ฆฌ๋ ์์์ ํ์ ์ ์ฌ๋ฌ๊ฐ๋ก ๋ฐ๊พธ๊ณ , ํ์ด์ ์ข ๋ฅ์ ๋ฐ๋ผ์ (๊ธด ํ์ด, ์งง์ ํ์ด, ์ค๊ฐ ํ์ด) ๋ค๋ฅธ ์์น์ ์๋ ํ์ ์ ๋ง์ถ๊ธฐ๋ก ํ๋ค๊ณ ํฉ์๋ค.
์ด ๊ฒฝ์ฐ, ์ฐ๋ฆฌ๋ ํ์ ๋ค์ labelling ํด์ ํ์ด์ ์๊ธฐ ์ ์ ๋ง์ถฐ์ผ ํ๋ ํ์ ์ ํ์ธํ๊ณ , ์ ์ดํ ํด๋น ํ์ด๊ณผ ํ์ ์ ์ฐ๊ด์ง์ฌ ๋ถ์ ํ๋๋ฅผ ์ธก์ ํ์ฌ (๋ชฉ์ ํจ์), ์ด๋ฅผ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ ํตํด ๊ฐ์ ํฉ๋๋ค.
์ฆ, ํ์ด(๋ฐ์ดํฐ)๊ณผ ํ์ (๋ชฉ์ )์ ๋ผ๋ฒจ๋งํ์ฌ ๋ฌถ์ด์, ํ์ต ์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค.
ํ์ง๋ง ์ฐ๋ฆฌ๋ ์์๊ณผ ์๊ฐ์ ์ ํ ๋๋ฌธ์ ํญ์ ์ด labelling์ ํ ์ ์์ง๋ ์์ต๋๋ค.
์ด๋ฐ ๊ฒฝ์ฐ, ์ฐ๋ฆฌ๋ ๋ค๋ฅธ ํํ์ ํ์ต์ ์ ์ฉํฉ๋๋ค.
์ง๋ ํ์ต์ ์ข ๋ฅ๋ค์ Support Vector Machines (SVMs), Neural Networks (NNs), Deep Learning, Random Forests, Boyesian Networks๊ฐ ์์ต๋๋ค.
2. Unsupervised Learning (๋น์ง๋ ํ์ต)
์์ ํ์๊ธฐ ์์์์, ์ฐ๋ฆฌ๋ ํ์ ์ ๊ธฐ๊ณ์์ ์๋ ค์ฃผ์์์ต๋๋ค.
์ด๋ฒ์๋ ํ์ ์ ์ฃผ์ด์ฃผ์ง ์๊ณ , ๊ทธ๋ฅ ๋ฐ์ฌํ๊ฒ ํฉ๋๋ค.
์ด ๊ฒฝ์ฐ, ์ฐ๋ฆฌ๋ ๋ฌผ๋ก ์ด๊ณ ์ปดํจํฐ๋ ๋น์ฐํ ํ์ด(๋ฐ์ดํฐ)๋ค์ ์ข ๋ฅ์ ํน์ฑ์ ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ์, ์ปดํจํฐ๋ ์ฐ์ ์๋ง์ ์ํ์ฐฉ์ค๋ฅผ ๊ฑฐ์น๋ฉฐ ํ์ด(๋ฐ์ดํฐ)๋ค์ ํน์ฑ์ ๋ฐ๋ผ ๋ถ๋ฅํ ์ ์๊ฒ ๋ฉ๋๋ค.
๊ฐ๋ น ๊ธด ํ์ด, ์ค๊ฐ ํ์ด, ์งง์ ํ์ด๋ก ๋ถ๋ฅ(clustered)ํ์๋ค๊ณ ๊ฐ์ ํ๊ณ , ์ง๋ ํ์ต์์ ํ์ตํ ๊ฒ ์ฒ๋ผ ์ด์ด์ ํ์ตํ๊ฒ ๋ฉ๋๋ค.
๋ง์ฝ ๋ฐ์ดํฐ์ ํฌ๊ธฐ๊ฐ ๋๋ฌด๋๋ ํฌ๋ค๋ฉด, ์ฐ๋ฆฌ๋ ๋น์ง๋ ํ์ต์ ํ๊ฒ ๋ ๊ฒ ์ ๋๋ค.
์ง๋ ํ์ต๊ณผ ๋น์ง๋ ํ์ต์ ๊ฐ์ด ์ ์ฉ๋์ด ๋ตํด์ผ ํ๋ ์ง๋ฌธ์ ๋ง์ถ์ด ํ์ฉ๋ ์ ์์ต๋๋ค.
์ฐ๋ฆฌ์ ์์์์, ๋น์ง๋ ํ์ต์ ํตํด ๋ฐ์ดํฐ๋ฅผ ํด๋ฌ์คํฐํ ํ๊ณ , ์ด ๋ถ๋ฅ์ ๋ผ๋ฒจ๋ง์ ํตํด ํ์ด๊ณผ ํ์ ์ ์๋ณํ์ฌ ์ง๋ ํ์ต์ ์งํํ ๊ฒ ์ฒ๋ผ, ๋๊ฐ์ง ๋ฐฉ๋ฒ์ ํจ๊ป ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
๋น์ง๋ ํ์ต์ ์ข ๋ฅ๋ค์๋ k-mean, ๊ทธ๋ฆฌ๊ณ deep learning์ด ์์ต๋๋ค.
์ง๋ ํ์ต๊ณผ ๋น์ง๋ ํ์ต์ ํต์ฌ ์ฐจ์ด, Labelling์ ์ ๋ฌด๋ ๋ค์ ๊ทธ๋ฆผ์ผ๋ก ํ๋ฅญํ๊ฒ ๋ฌ์ฌ๊ฐ ๋์ด์์ต๋๋ค.
3. Reinforcement Learning (๊ฐํ ํ์ต)
๊ฐํ ํ์ต์์, ์ฐ๋ฆฌ๋ Reward System (๋ณด์ ์์คํ )์ ์ ์ฉํ๊ฒ ๋ฉ๋๋ค.
์ฐ๋ฆฌ์ ํ์๊ธฐ ๋ก๋ด์ด ํ์ ์ ๋์ฑ ๊ฐ๊น์ด ํ์ ์ ๋ ๋ง๋ค (๋์ฑ ์ข์ ๋ชจ๋ธ์ ๊ตฌํํ ๋ ๋ง๋ค), ์ด์ฝ๋ฆฟ(๋ณด์)์ ์ค๋ค๊ณ ํฉ์๋ค.
๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ ์ ๋ณด๋ค ํ์ ๋ชป์๋ฉด ์ด์ฝ๋ฆฟ(๋ณด์)์ ์ฃผ์ง ์๋๋ค๊ณ ํฉ์๋ค.
์ด ๊ฒฝ์ฐ, ์ฐ๋ฆฌ๋ ์๋ฌ๋ฅผ ์ต์ํํ๋ ๊ฒ์ด ์๋๋ผ, ๋ณด์์ ์ต๋ํ ํ๋ ค๊ณ ํ๊ณ ์์ต๋๋ค.
๋ค์ ๋งํ์๋ฉด, Objective Function (๋ชฉ์ ํจ์)๋ฅผ ์ต๋ํ ํ๋ ค๊ณ ํฉ๋๋ค.
ํ์๊ธฐ ๋ก๋ด์ ๊ด์ ์์ ํด์ํด๋ณด๊ฒ ์ต๋๋ค.
๋ก๋ด์ด ํ์ ์๋๋ฐ, ์ ๋ฒ๋ณด๋ค ์ ์๊ณ ๋ณด์์ ์ป์๋ค๋ฉด, ๋ก๋ด์ ์ด ๋ณด์์ ๋ค์์๋ ์ป๊ธฐ ์ํด์ ์ด๋ฒ์ ์ด๋ค ๊ฑธ ๋ ์ ํ๋์ง๋ฅผ ๋ถ์ํ์ฌ ํ์ตํฉ๋๋ค.
๋ฐ๋๋ก ์ ๋ฒ๋ณด๋ค ๋ชป ์ด์ ๋ณด์์ ์ป์ง ๋ชปํ๋ค๋ฉด, ๋ก๋ด์ ์ด๋ค๊ฑธ ๋ค๋ฅด๊ฒ ํด์ ๋ ๋ชป ์๊ฑด์ง๋ฅผ ๋ถ์ํ๊ณ , ๋ฐ๋ณตํ์ง ์๋๋ก ํ์ตํฉ๋๋ค.
์ด ๊ณผ์ ์ ์ฐ๋ฆฌ๋ Positive Reinforcement (๊ธ์ ๊ฐํ) ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค
์ ๊ฐ ์ด ๊ธ์์ ์์๋ก ๋ ํ์ด์๋ ๋ก๋ด(machine)์ ๋น์ ๋ฅผ ํ์ด์ ์ค๋ช ํ์๋ฉด,
๊ธฐ๊ณ์ ํ ์๋ ๋ฐฉ๋ฒ์ ๊ธฐ๊ณ์ ๋ชจ๋ธ์ ๋ปํ๋ฉฐ, ํ์ค์์๋ ๋งค์ฐ ๋ณต์กํ ์์์ผ๋ก ๊ตฌ์กฐ๋ฉ๋๋ค.
๊ธฐ๊ณ๊ฐ ํ์ตํ๊ธฐ ์ํด ์ฌ์ฉํ ํ์ด๋ค์ ๋ค์ํ ๋ฐ์ดํฐ์ ์ด๋ฉฐ, ํ์ด์ ๋ง์ถ๋ ค๊ณ ํ ํ์ ๋ค์ ๋ค์ํ๊ณ ์๋ํํ ์ ์๋ ๋ชฉ์ ๋ค์ ๋๋ค.
์ฃผ์๊น๊ฒ ๋ณด์ ๋ถ๋ค์ ์ง๋ ํ์ต๊ณผ ๋น์ง๋ ํ์ต์ ๋ชจ๋ ๋ฅ ๋ฌ๋์ด ํฌํจ๋๋ ๊ฒ์ ์ธ์งํ์ จ์ ๊ฒ ์ ๋๋ค.
๋ฅ ๋ฌ๋์ ๊ทธ๋์์ ๋ค๋ฅธ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ๊ณผ๋ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
๊ทธ๋ฆฌ๊ณ ๋์ฑ ๋์ ๋ฒ์ฉ์ฑ๊ณผ ์ค์ฉ์ฑ, ๊ทธ๋ฆฌ๊ณ ๋งค์ฐ ๋์ ์ ํ๋๋ฅผ ์๋ํฉ๋๋ค.
์ค์ํ ์ ์ ์ด๋ฌํ ๋ฅ ๋ฌ๋๋ ์ง๋, ๋น์ง๋, ๊ฐํ ํ์ต์ผ๋ก ๋๋์ด์ง๋๋ค.
์ฆ, ๋ฅ ๋ฌ๋๋ ๋จธ์ ๋ฌ๋๊ณผ ๋์ผํ ๋ฌธ์ ๋ฅผ ํ์ง๋ง, ๊ฐ๋ ์ ์ผ๋ก ๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค๊ณ ์ดํดํ๋ฉด ๋๊ฒ ์ต๋๋ค.
์ค์ํ์ ์์๋ฅผ ์ดํด๋ณผ๊น์?
์ฌ๊ธฐ ๊ฐ์ง (Fraud Detection)์ ๋จธ์ ๋ฌ๋์ ๋งค์ฐ ์ข์ ์์์ ๋๋ค.
์ํ๊ณผ ๊ธ์ต๊ณ๋ ์ด๋ง์ด๋งํ ํฌ๊ธฐ์ ์ ์ฉ ์นด๋ ๊ฑฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํ๊ณ ์์ต๋๋ค.
์ํ์ ๊ณ ๊ฐ์ ์์ฐ์ ์ฌ๊ธฐ๋ก๋ถํฐ ๋ณดํธํ๊ธฐ ์ํด์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํฉ๋๋ค.
์ํ์ ๊ณผ๊ฑฐ์ ๊ฑฐ๋๋ค์ ์ ์์ ์ธ ๊ฑฐ๋์ ์ฌ๊ธฐ ๊ฑฐ๋๋ก ๋ถ๋ฅํ ์ ์์ต๋๋ค. (๊ณผ๊ฑฐ์ ์ผ์ด๋๊น์)
์ฆ, ๊ฑฐ๋๋ค์ ๋ผ๋ฒจ๋ง์ ํ ์ ์์ต๋๋ค.
๋ผ๋ฒจ๋ง์ ํ๊ธฐ ๋๋ฌธ์ ์ํ๋ค์ Supervised Learning, ์ง๋ ํ์ต์ ์งํํ ์ ์์ต๋๋ค.
์ด๋ก์จ ํ์ํ ๋ชจ๋ธ์ ์ฌ์ฉํด์, ์ค์๊ฐ์ผ๋ก ์กฐ๊ธ์ด๋ผ๋ ์ฌ๊ธฐ ๊ฑฐ๋์ ์ํ๋๊ฐ ๊ฐ์ง๋๋ฉด ์ด์ ๋์ฒ๋ฅผ ํฉ๋๋ค.