Data Science/๊ฐœ๋…๊ณผ ์šฉ์–ด

Machine Learning | ๋จธ์‹  ๋Ÿฌ๋‹

Chan Lee 2024. 5. 18. 11:43

Machine Learning (ML) ์€ ๋ฌด์—‡์ผ๊นŒ์š”?

๋จธ์‹  ๋Ÿฌ๋‹์€ ์ปดํ“จํ„ฐ์—๊ฒŒ ์šฐ๋ฆฌ์˜ ๋ฐ์ดํ„ฐ์— ๊ฐ€์žฅ ์ž˜ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๋ถ„์„ ๋ชจ๋ธ์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์ž‘ํ•ด์ฃผ๊ณ , ์ปดํ“จํ„ฐ์˜ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ๋งค์šฐ ์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ จ์˜ ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค.

 

์ง€๋‚œ ํฌ์ŠคํŠธ์—์„œ ์‚ดํŽด๋ณธ ์ „ํ†ต์  ๋ฐฉ๋ฒ•๋“ค๊ณผ๋Š” ๋‹ค๋ฅด๊ฒŒ, ์šฐ๋ฆฌ๋Š” ์ปดํ“จํ„ฐ์—๊ฒŒ ๋ชจ๋ธ์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์ •๋ณด๋Š” ์ฃผ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

(์šฐ๋ฆฌ๋„ ๋ชจ๋ฅด๋‹ˆ๊นŒ์š”)

์šฐ๋ฆฌ๊ฐ€ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ฃผ๋Š” ๊ฒƒ์€ ๋ชจ๋ธ์„ ์ฐพ๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค.

 

์ปดํ“จํ„ฐ๋Š” ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ ๋ชจ๋ธ์„ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.

์ตœ์ ์˜ ๋ชจ๋ธ์„ ์ฐพ๋Š” ํ–‰์œ„๋Š” ์ปดํ“จํ„ฐ์˜ ๋ชซ์ž…๋‹ˆ๋‹ค.

์—ฌ๊ธฐ์„œ '์ตœ์ '์˜ ๊ธฐ์ค€์„ ์–ด๋–ป๊ฒŒ ์ •ํ•˜๋ƒ์— ๋”ฐ๋ผ์„œ ํ•™์Šต ๋ฐ˜๋ณต์˜ ํšŸ์ˆ˜๊ฐ€ ๋ณ€ํ•˜๊ฒ ์ฃ ?

 

๋จธ์‹  ๋Ÿฌ๋‹์˜ ๊ณผ์ •์„ ์‰ฝ๊ฒŒ ์š”์•ฝํ•˜๋ฉด, Trial-and-Error ๊ณผ์ •, ์ฆ‰ ์‹œ๋„์™€ ์—๋Ÿฌ์˜ ๊ณผ์ •์ž…๋‹ˆ๋‹ค.

๊ฐ ์—ฐ์†์ ์ธ ์‹œ๋„(ํ•™์Šต)๋Š” '๋ฌด์กฐ๊ฑด' ์ง€๋‚œ ์‹œ๋„(ํ•™์Šต)๊ณผ ๋™์ผํ•˜๊ฑฐ๋‚˜ ๋”์šฑ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ด๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

์ด๋Ÿฌํ•œ ๋จธ์‹  ๋Ÿฌ๋‹์—๋Š” ํฌ๊ฒŒ 4๊ฐ€์ง€์˜ ํ•„์ˆ˜ ๊ตฌ์„ฑ ์š”์†Œ๊ฐ€ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.

1. ๋ฐ์ดํ„ฐ 

2. ๋ชจ๋ธ

3. Objective Function (๋ชฉ์  ํ•จ์ˆ˜)

4. Optimization Algorithm (์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜)

์ž…๋‹ˆ๋‹ค.

 

์ปดํ“จํ„ฐ์˜ ๋ชจ๋ธ์ด ์ œ๊ณต๋œ ๋ฐ์ดํ„ฐ์— ๋ชฉ์  ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํ‰๊ฐ€ํ•˜๊ณ , ํ‰๊ฐ€๋œ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฑฐ์ณ ๋”์šฑ ๋‚˜์€ ๋ชจ๋ธ์„ deriveํ•˜๋Š” ๊ณผ์ •์˜ ๋ฐ˜๋ณต์„ ๋จธ์‹  ๋Ÿฌ๋‹์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์˜ˆ์‹œ๋ฅผ ๋“ค์–ด๋ณผ๊นŒ์š”?

๋กœ๋ด‡์—๊ฒŒ ํ™œ๊ณผ ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ํ™”์‚ด๋“ค์„ ์ œ๊ณตํ•œ ๋’ค, ํ‘œ์ ์˜ ์ค‘์•™์— ๊ฐ€์žฅ ์ž˜ ๋งž์ถœ ์ˆ˜ ์žˆ๋„๋ก ๋จธ์‹  ๋Ÿฌ๋‹์„ ์‹œ์ผฐ๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค.

์—ฌ๊ธฐ์„œ ๋ฐ์ดํ„ฐ๋Š” ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ํ™”์‚ด์ด ๋  ๊ฒƒ์ด๊ณ , ๋ชจ๋ธ์€ ์ปดํ“จํ„ฐ๊ฐ€ ์ ์šฉํ•˜๋Š” ํ™”์‚ด์„ ์˜๋Š” ๋ฐฉ๋ฒ•์ด ๋˜๊ฒ ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ๋ชฉ์  ํ•จ์ˆ˜๋Š” ํ‰๊ท ์ ์ธ ํ‘œ์  ์ค‘์•™์—์„œ์˜ ํ™”์‚ด ๊ฑฐ๋ฆฌ๋ผ๊ณ  ๋ณด๊ณ , ์ด๊ฒŒ 0์— ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก ์ข‹์€ ๊ฒƒ์ด๊ฒ ์ฃ ?

๊ทธ๋ ‡๋‹ค๋ฉด ๊ฐ ํ•™์Šต์„ ํ†ตํ•ด ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์œผ๋กœ ํ™œ์„ ์˜๋Š” ๊ฒƒ์„ ์ˆ˜๋งŽ์ด ๋ฐ˜๋ณตํ•œ ๊ธฐ๊ณ„๊ฐ€, ๊ฐ trial ์ดํ›„์— ๋ชฉ์  ํ•จ์ˆ˜์˜ ๊ฐ’์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜์—ฌ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ˆ˜๋งŽ์ด ์ ์šฉํ•˜๊ฒŒ ๋˜๊ณ , ์กฐ๊ธˆ์”ฉ ๋” ๋‚˜์€ ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๊ฒŒ ๋˜๋Š” ๊ฒƒ ์ž…๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ ์ฃผ๋ชฉํ•  ์ ์€ ์šฐ๋ฆฌ๊ฐ€ ๋ชฉ์ ์„ ์ œ์‹œํ•ด ์ฃผ์—ˆ์„ ๋ฟ, ์šฐ๋ฆฌ๋„ ํ™œ์„ ๊ฐ€์žฅ ์ž˜ ์˜๋Š” ์ตœ์ ์˜ ๋ฐฉ๋ฒ•์€ ๋ชจ๋ฅธ๋‹ค๋Š” ๊ฒƒ ์ž…๋‹ˆ๋‹ค.

ํ˜น์‹œ ๊ธฐ๊ณ„๊ฐ€ ์šฐ๋ฆฌ๊ฐ€ ์ธ๋ฅ˜ ์—ญ์‚ฌ๋™์•ˆ ํ•œ๋ฒˆ๋„ ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜๋˜ ์—„์ฒญ๋‚œ ๋ฐฉ๋ฒ•์„ ์•Œ๊ฒŒ ๋  ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ์ ์„ ์ธ์ง€ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

 

 

์ด๋Ÿฌํ•œ ๋จธ์‹  ๋Ÿฌ๋‹์˜ ์ข…๋ฅ˜๋“ค์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

Types of Machine Learning:

1. Supervised Learning (์ง€๋„ ํ•™์Šต)

์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ•™์Šต์˜ ๊ณผ์ •์ด ์„ ์ƒ์ด ํ•™์ƒ์„ ์ง€๋„ํ•™์Šต ํ•˜๋Š” ๊ณผ์ •๊ณผ ๋‹ฎ์•„ ์žˆ๋‹ค๊ณ  ํ•˜์—ฌ ๋ถ™์€ ์ด๋ฆ„์ž…๋‹ˆ๋‹ค.

์œ„์˜ ํ™œ์˜๊ธฐ ๋ชจ๋ธ ์˜ˆ์‹œ๊ฐ€ ๋ฐ”๋กœ ์ด ์ง€๋„ ํ•™์Šต์˜ ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.

์‹ค์ œ์™€ ๋” ๊ฐ™์•„์ง€๊ธฐ ์œ„ํ•ด์„œ, ์šฐ๋ฆฌ๋Š” ์˜ˆ์‹œ์˜ ํ‘œ์ ์„ ์—ฌ๋Ÿฌ๊ฐœ๋กœ ๋ฐ”๊พธ๊ณ , ํ™”์‚ด์˜ ์ข…๋ฅ˜์— ๋”ฐ๋ผ์„œ (๊ธด ํ™”์‚ด, ์งง์€ ํ™”์‚ด, ์ค‘๊ฐ„ ํ™”์‚ด) ๋‹ค๋ฅธ ์œ„์น˜์— ์žˆ๋Š” ํ‘œ์ ์„ ๋งž์ถ”๊ธฐ๋กœ ํ–ˆ๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค.

์ด ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ํ‘œ์ ๋“ค์„ labelling ํ•ด์„œ ํ™”์‚ด์„ ์˜๊ธฐ ์ „์— ๋งž์ถฐ์•ผ ํ•˜๋Š” ํ‘œ์ ์„ ํ™•์ธํ•˜๊ณ , ์œ ์ดํ›„ ํ•ด๋‹น ํ™”์‚ด๊ณผ ํ‘œ์ ์„ ์—ฐ๊ด€์ง€์—ฌ ๋ถ€์ •ํ™•๋„๋ฅผ ์ธก์ •ํ•˜์—ฌ (๋ชฉ์  ํ•จ์ˆ˜), ์ด๋ฅผ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค.

์ฆ‰, ํ™”์‚ด(๋ฐ์ดํ„ฐ)๊ณผ ํ‘œ์ (๋ชฉ์ )์„ ๋ผ๋ฒจ๋งํ•˜์—ฌ ๋ฌถ์–ด์„œ, ํ•™์Šต ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

 

ํ•˜์ง€๋งŒ ์šฐ๋ฆฌ๋Š” ์ž์›๊ณผ ์‹œ๊ฐ„์˜ ์ œํ•œ ๋•Œ๋ฌธ์— ํ•ญ์ƒ ์ด labelling์„ ํ•  ์ˆ˜ ์žˆ์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ํ•™์Šต์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.

 

์ง€๋„ ํ•™์Šต์˜ ์ข…๋ฅ˜๋“ค์€ Support Vector Machines (SVMs), Neural Networks (NNs), Deep Learning, Random Forests, Boyesian Networks๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

 

2. Unsupervised Learning (๋น„์ง€๋„ ํ•™์Šต)

์œ„์˜ ํ™œ์˜๊ธฐ ์˜ˆ์‹œ์—์„œ, ์šฐ๋ฆฌ๋Š” ํ‘œ์ ์„ ๊ธฐ๊ณ„์—์„œ ์•Œ๋ ค์ฃผ์—ˆ์—ˆ์Šต๋‹ˆ๋‹ค. 

์ด๋ฒˆ์—๋Š” ํ‘œ์ ์„ ์ฃผ์–ด์ฃผ์ง€ ์•Š๊ณ , ๊ทธ๋ƒฅ ๋ฐœ์‚ฌํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. 

์ด ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ๋ฌผ๋ก ์ด๊ณ  ์ปดํ“จํ„ฐ๋„ ๋‹น์—ฐํžˆ ํ™”์‚ด(๋ฐ์ดํ„ฐ)๋“ค์˜ ์ข…๋ฅ˜์™€ ํŠน์„ฑ์„ ๋ชจ๋ฅด๊ธฐ ๋•Œ๋ฌธ์—, ์ปดํ“จํ„ฐ๋Š” ์šฐ์„  ์ˆ˜๋งŽ์€ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ๊ฑฐ์น˜๋ฉฐ ํ™”์‚ด(๋ฐ์ดํ„ฐ)๋“ค์„ ํŠน์„ฑ์— ๋”ฐ๋ผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๊ฐ€๋ น ๊ธด ํ™”์‚ด, ์ค‘๊ฐ„ ํ™”์‚ด, ์งง์€ ํ™”์‚ด๋กœ ๋ถ„๋ฅ˜(clustered)ํ•˜์˜€๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๊ณ , ์ง€๋„ ํ•™์Šต์—์„œ ํ•™์Šตํ•œ ๊ฒƒ ์ฒ˜๋Ÿผ ์ด์–ด์„œ ํ•™์Šตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

๋งŒ์•ฝ ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ๊ฐ€ ๋„ˆ๋ฌด๋‚˜๋„ ํฌ๋‹ค๋ฉด, ์šฐ๋ฆฌ๋Š” ๋น„์ง€๋„ ํ•™์Šต์„ ํ•˜๊ฒŒ ๋  ๊ฒƒ ์ž…๋‹ˆ๋‹ค.

์ง€๋„ ํ•™์Šต๊ณผ ๋น„์ง€๋„ ํ•™์Šต์€ ๊ฐ™์ด ์ ์šฉ๋˜์–ด ๋‹ตํ•ด์•ผ ํ•˜๋Š” ์งˆ๋ฌธ์— ๋งž์ถ”์–ด ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ์˜ ์˜ˆ์‹œ์—์„œ, ๋น„์ง€๋„ ํ•™์Šต์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ํด๋Ÿฌ์Šคํ„ฐํ™” ํ•˜๊ณ , ์ด ๋ถ„๋ฅ˜์™€ ๋ผ๋ฒจ๋ง์„ ํ†ตํ•ด ํ™”์‚ด๊ณผ ํ‘œ์ ์„ ์‹๋ณ„ํ•˜์—ฌ ์ง€๋„ ํ•™์Šต์„ ์ง„ํ–‰ํ•œ ๊ฒƒ ์ฒ˜๋Ÿผ, ๋‘๊ฐ€์ง€ ๋ฐฉ๋ฒ•์€ ํ•จ๊ป˜ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๋น„์ง€๋„ ํ•™์Šต์˜ ์ข…๋ฅ˜๋“ค์—๋Š” k-mean, ๊ทธ๋ฆฌ๊ณ  deep learning์ด ์žˆ์Šต๋‹ˆ๋‹ค.

 

์ง€๋„ ํ•™์Šต๊ณผ ๋น„์ง€๋„ ํ•™์Šต์˜ ํ•ต์‹ฌ ์ฐจ์ด, Labelling์˜ ์œ ๋ฌด๋Š” ๋‹ค์Œ ๊ทธ๋ฆผ์œผ๋กœ ํ›Œ๋ฅญํ•˜๊ฒŒ ๋ฌ˜์‚ฌ๊ฐ€ ๋˜์–ด์žˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜: https://www.researchgate.net/figure/Supervised-and-unsupervised-machine-learning-a-Schematic-representation-of-an_fig3_351953193

 

3. Reinforcement Learning (๊ฐ•ํ™” ํ•™์Šต)

๊ฐ•ํ™” ํ•™์Šต์—์„œ, ์šฐ๋ฆฌ๋Š” Reward System (๋ณด์ƒ ์‹œ์Šคํ…œ)์„ ์ ์šฉํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์šฐ๋ฆฌ์˜ ํ™œ์˜๊ธฐ ๋กœ๋ด‡์ด ํ‘œ์ ์— ๋”์šฑ ๊ฐ€๊นŒ์šด ํ™œ์„ ์  ๋•Œ ๋งˆ๋‹ค (๋”์šฑ ์ข‹์€ ๋ชจ๋ธ์„ ๊ตฌํ˜„ํ•  ๋•Œ ๋งˆ๋‹ค), ์ดˆ์ฝœ๋ฆฟ(๋ณด์ƒ)์„ ์ค€๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์šฐ๋ฆฌ๋Š” ์ „๋ณด๋‹ค ํ™œ์„ ๋ชป์˜๋ฉด ์ดˆ์ฝœ๋ฆฟ(๋ณด์ƒ)์„ ์ฃผ์ง€ ์•Š๋Š”๋‹ค๊ณ  ํ•ฉ์‹œ๋‹ค.

 

์ด ๊ฒฝ์šฐ, ์šฐ๋ฆฌ๋Š” ์—๋Ÿฌ๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๋ณด์ƒ์„ ์ตœ๋Œ€ํ™” ํ•˜๋ ค๊ณ  ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋‹ค์‹œ ๋งํ•˜์ž๋ฉด, Objective Function (๋ชฉ์  ํ•จ์ˆ˜)๋ฅผ ์ตœ๋Œ€ํ™” ํ•˜๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

ํ™œ์˜๊ธฐ ๋กœ๋ด‡์˜ ๊ด€์ ์—์„œ ํ•ด์„ํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋กœ๋ด‡์ด ํ™œ์„ ์ˆ๋Š”๋ฐ, ์ €๋ฒˆ๋ณด๋‹ค ์ž˜ ์ˆ๊ณ  ๋ณด์ƒ์„ ์–ป์—ˆ๋‹ค๋ฉด, ๋กœ๋ด‡์€ ์ด ๋ณด์ƒ์„ ๋‹ค์Œ์—๋„ ์–ป๊ธฐ ์œ„ํ•ด์„œ ์ด๋ฒˆ์— ์–ด๋–ค ๊ฑธ ๋” ์ž˜ ํ–ˆ๋Š”์ง€๋ฅผ ๋ถ„์„ํ•˜์—ฌ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

๋ฐ˜๋Œ€๋กœ ์ €๋ฒˆ๋ณด๋‹ค ๋ชป ์ด์„œ ๋ณด์ƒ์„ ์–ป์ง€ ๋ชปํ–ˆ๋‹ค๋ฉด, ๋กœ๋ด‡์€ ์–ด๋–ค๊ฑธ ๋‹ค๋ฅด๊ฒŒ ํ•ด์„œ ๋” ๋ชป ์œ๊ฑด์ง€๋ฅผ ๋ถ„์„ํ•˜๊ณ , ๋ฐ˜๋ณตํ•˜์ง€ ์•Š๋„๋ก ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

์ด ๊ณผ์ •์„ ์šฐ๋ฆฌ๋Š” Positive Reinforcement (๊ธ์ • ๊ฐ•ํ™”) ๋ผ๊ณ  ๋ถ€๋ฆ…๋‹ˆ๋‹ค

 

 

์ œ๊ฐ€ ์ด ๊ธ€์—์„œ ์˜ˆ์‹œ๋กœ ๋“  ํ™”์‚ด์˜๋Š” ๋กœ๋ด‡(machine)์˜ ๋น„์œ ๋ฅผ ํ’€์–ด์„œ ์„ค๋ช…ํ•˜์ž๋ฉด,

๊ธฐ๊ณ„์˜ ํ™œ ์˜๋Š” ๋ฐฉ๋ฒ•์€ ๊ธฐ๊ณ„์˜ ๋ชจ๋ธ์„ ๋œปํ•˜๋ฉฐ, ํ˜„์‹ค์—์„œ๋Š” ๋งค์šฐ ๋ณต์žกํ•œ ์ˆ˜์‹์œผ๋กœ ๊ตฌ์กฐ๋ฉ๋‹ˆ๋‹ค.

๊ธฐ๊ณ„๊ฐ€ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•œ ํ™”์‚ด๋“ค์€ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹์ด๋ฉฐ, ํ™”์‚ด์„ ๋งž์ถ”๋ ค๊ณ  ํ•œ ํ‘œ์ ๋“ค์€ ๋‹ค์–‘ํ•˜๊ณ  ์ˆ˜๋Ÿ‰ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชฉ์ ๋“ค์ž…๋‹ˆ๋‹ค.

 

 

์ฃผ์˜๊นŠ๊ฒŒ ๋ณด์‹  ๋ถ„๋“ค์€ ์ง€๋„ ํ•™์Šต๊ณผ ๋น„์ง€๋„ ํ•™์Šต์— ๋ชจ๋‘ ๋”ฅ ๋Ÿฌ๋‹์ด ํฌํ•จ๋˜๋Š” ๊ฒƒ์„ ์ธ์ง€ํ•˜์…จ์„ ๊ฒƒ ์ž…๋‹ˆ๋‹ค.

๋”ฅ ๋Ÿฌ๋‹์€ ๊ทธ๋™์•ˆ์˜ ๋‹ค๋ฅธ ๋จธ์‹  ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๊ณผ๋Š” ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ๋”์šฑ ๋„“์€ ๋ฒ”์šฉ์„ฑ๊ณผ ์‹ค์šฉ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๋งค์šฐ ๋†’์€ ์ •ํ™•๋„๋ฅผ ์ž๋ž‘ํ•ฉ๋‹ˆ๋‹ค.

 

์ค‘์š”ํ•œ ์ ์€ ์ด๋Ÿฌํ•œ ๋”ฅ ๋Ÿฌ๋‹๋„ ์ง€๋„, ๋น„์ง€๋„, ๊ฐ•ํ™” ํ•™์Šต์œผ๋กœ ๋‚˜๋ˆ„์–ด์ง‘๋‹ˆ๋‹ค.

์ฆ‰, ๋”ฅ ๋Ÿฌ๋‹๋„ ๋จธ์‹  ๋Ÿฌ๋‹๊ณผ ๋™์ผํ•œ ๋ฌธ์ œ๋ฅผ ํ’€์ง€๋งŒ, ๊ฐœ๋…์ ์œผ๋กœ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ์ดํ•ดํ•˜๋ฉด ๋˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

 

์‹ค์ƒํ™œ์˜ ์˜ˆ์‹œ๋ฅผ ์‚ดํŽด๋ณผ๊นŒ์š”?

์‚ฌ๊ธฐ ๊ฐ์ง€ (Fraud Detection)์€ ๋จธ์‹  ๋Ÿฌ๋‹์˜ ๋งค์šฐ ์ข‹์€ ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.

 

์€ํ–‰๊ณผ ๊ธˆ์œต๊ณ„๋Š” ์–ด๋งˆ์–ด๋งˆํ•œ ํฌ๊ธฐ์˜ ์‹ ์šฉ ์นด๋“œ ๊ฑฐ๋ž˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์€ํ–‰์€ ๊ณ ๊ฐ์˜ ์ž์‚ฐ์„ ์‚ฌ๊ธฐ๋กœ๋ถ€ํ„ฐ ๋ณดํ˜ธํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋จธ์‹  ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

 

์€ํ–‰์€ ๊ณผ๊ฑฐ์˜ ๊ฑฐ๋ž˜๋“ค์„ ์ •์ƒ์ ์ธ ๊ฑฐ๋ž˜์™€ ์‚ฌ๊ธฐ ๊ฑฐ๋ž˜๋กœ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. (๊ณผ๊ฑฐ์˜ ์ผ์ด๋‹ˆ๊นŒ์š”)

์ฆ‰, ๊ฑฐ๋ž˜๋“ค์„ ๋ผ๋ฒจ๋ง์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๋ผ๋ฒจ๋ง์„ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์€ํ–‰๋“ค์€ Supervised Learning, ์ง€๋„ ํ•™์Šต์„ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋กœ์จ ํƒ„์ƒํ•œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด์„œ, ์‹ค์‹œ๊ฐ„์œผ๋กœ ์กฐ๊ธˆ์ด๋ผ๋„ ์‚ฌ๊ธฐ ๊ฑฐ๋ž˜์˜ ์œ„ํ—˜๋„๊ฐ€ ๊ฐ์ง€๋˜๋ฉด ์ด์— ๋Œ€์ฒ˜๋ฅผ ํ•ฉ๋‹ˆ๋‹ค.