Data Science/๊ฐœ๋…๊ณผ ์šฉ์–ด

Machine Learning (ML) ์€ ๋ฌด์—‡์ผ๊นŒ์š”?๋จธ์‹  ๋Ÿฌ๋‹์€ ์ปดํ“จํ„ฐ์—๊ฒŒ ์šฐ๋ฆฌ์˜ ๋ฐ์ดํ„ฐ์— ๊ฐ€์žฅ ์ž˜ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๋ถ„์„ ๋ชจ๋ธ์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ œ์ž‘ํ•ด์ฃผ๊ณ , ์ปดํ“จํ„ฐ์˜ ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ๋งค์šฐ ์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ จ์˜ ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค. ์ง€๋‚œ ํฌ์ŠคํŠธ์—์„œ ์‚ดํŽด๋ณธ ์ „ํ†ต์  ๋ฐฉ๋ฒ•๋“ค๊ณผ๋Š” ๋‹ค๋ฅด๊ฒŒ, ์šฐ๋ฆฌ๋Š” ์ปดํ“จํ„ฐ์—๊ฒŒ ๋ชจ๋ธ์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์ •๋ณด๋Š” ์ฃผ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.(์šฐ๋ฆฌ๋„ ๋ชจ๋ฅด๋‹ˆ๊นŒ์š”)์šฐ๋ฆฌ๊ฐ€ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ฃผ๋Š” ๊ฒƒ์€ ๋ชจ๋ธ์„ ์ฐพ๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค. ์ปดํ“จํ„ฐ๋Š” ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ ๋ชจ๋ธ์„ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค.์ตœ์ ์˜ ๋ชจ๋ธ์„ ์ฐพ๋Š” ํ–‰์œ„๋Š” ์ปดํ“จํ„ฐ์˜ ๋ชซ์ž…๋‹ˆ๋‹ค.์—ฌ๊ธฐ์„œ '์ตœ์ '์˜ ๊ธฐ์ค€์„ ์–ด๋–ป๊ฒŒ ์ •ํ•˜๋ƒ์— ๋”ฐ๋ผ์„œ ํ•™์Šต ๋ฐ˜๋ณต์˜ ํšŸ์ˆ˜๊ฐ€ ๋ณ€ํ•˜๊ฒ ์ฃ ? ๋จธ์‹  ๋Ÿฌ๋‹์˜ ๊ณผ์ •์„ ์‰ฝ๊ฒŒ ์š”์•ฝํ•˜๋ฉด, Trial-and-Error ๊ณผ์ •, ์ฆ‰ ์‹œ๋„์™€..
์ง€๋‚œ ํฌ์ŠคํŠธ๊นŒ์ง€ ์‚ดํŽด๋ณด์•˜๋˜ ํ–‰์œ„๋“ค, data์™€ big data์˜ ์ฒ˜๋ฆฌ์™€ business intelligence๋Š” ๊ณผ๊ฑฐ์— ์ผ์–ด๋‚œ ์ผ๋“ค์„ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•œ ์ง€ํ–ฅ์ ์„ ๊ฐ€์ง„ ํ–‰์œ„๋“ค์ด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŠธ์—์„œ๋Š” ์ด๋ฅผ ํ†ตํ•ด ๊ถ๊ทน์ ์œผ๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋‹ค๊ฐ€๊ฐ€๋ ค๊ณ  ํ•˜๋Š” ๋ฏธ๋ž˜ ๋ถ„์„ ์ค‘, ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•๋“ค์— ๋Œ€ํ•ด์„œ ์†Œ๊ฐœํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. Traditional Methods๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋ฉ๋‹ˆ๋‹ค.A set of methods that are derived mainly from statistics and are adopted for business.Statistic, ์ฆ‰ ์ƒ˜ํ”Œ ๋ฐ์ดํ„ฐ์—์„œ ๊ตฌํ•œ ํ†ต๊ณ„์  ๊ฐ’๋“ค์œผ๋กœ๋ถ€ํ„ฐ ์œ ์ถ”๋˜๊ณ , ๋น„์ฆˆ๋‹ˆ์Šค๋“ค์— ์‚ฌ์šฉ๋˜๋Š” ๋ฐฉ๋ฒ•๋“ค์„ ์ด์นญํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ traditional methods๋Š” ๋ฏธ๋ž˜์˜ ํผํฌ๋จผ์Šค๋ฅผ ์˜ˆ์ธกํ•˜๋Š”๋ฐ ๋†’์€ ..
Business Intelligence (BI)๋Š” ๋ฌด์—‡์ผ๊นŒ์š”?Business Intelligence, BI๋Š” ๊ณผ๊ฑฐ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„, ์ดํ•ด, ์„ค๋ช… ๋ฐ ๋ณด๊ณ ํ•˜๋Š” ๊ณผ์ •์— ํฌํ•จ๋œ ๋ชจ๋“  tool์ž…๋‹ˆ๋‹ค.๋Œ€์ƒ ๋น„์ฆˆ๋‹ˆ์Šค์˜ ๋งค์ถœ์ด ์ฆ๊ฐ€ํ•˜์˜€๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์™œ ์ฆ๊ฐ€ํ•˜์˜€๋Š”์ง€๋ฅผ ๋ถ„์„ํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋ฉด ์ง๊ด€์ ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” BI๋ฅผ ํ†ตํ•ด์„œ ์•„์ด๋””์–ด์™€ ํ†ต์ฐฐ๋ ฅ์„ ์–ป๊ณ , ๋ฏธ๋ž˜์˜ ๊ฒฐ์ •์— ๋„์›€์„ ์ฃผ๊ธฐ๋ฅผ ์›ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ƒํ™œ์˜ ์˜ˆ์‹œ๋กœ๋Š”, ์„ฑ์ˆ˜๊ธฐ์— (์ˆ˜์š”๊ฐ€ ๋Š˜์–ด๋‚˜๋Š” ์‹œ๊ธฐ์—) ํ˜ธํ…” ๊ฐ€๊ฒฉ์„ ์˜ฌ๋ฆฌ๋Š” price optimization์ด ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.๊ณผ๊ฑฐ์˜ ์ˆ™๋ฐ•๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ฐฉ์˜ ๊ฐ€๊ฒฉ์„ ์ตœ์ ํ™”ํ•˜์—ฌ ์ˆ˜์ต์„ ์ตœ๋Œ€ํ™” ์‹œํ‚ค๋Š” ํ–‰์œ„๊ฐ€ ๋˜๊ฒ ์Šต๋‹ˆ๋‹ค. BI๋ฅผ ๋”์šฑ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด, ๋ช‡๊ฐ€์ง€ ๊ฐœ๋…๋“ค์„ ์†Œ๊ฐœํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.Observation (๊ด€์ฐฐ): ์ˆ˜ํ•™์ ์œผ๋กœ ๋‹ค๋ฃจ์–ด์งˆ ์ˆ˜ ์—†๋Š”..
Big Data๋Š” Traditional Data์™€ ์ƒ๋ฐ˜๋˜๋Š” ๋ฐ์ดํ„ฐ๋“ค๋กœ, ๋งค์šฐ ํฐ ๋ฐ์ดํ„ฐ๋“ค์„ ์ง€์นญํ•ฉ๋‹ˆ๋‹ค.๋น… ๋ฐ์ดํ„ฐ๋Š” ๊ตฌ์กฐํ™” ๋œ ์ƒํƒœ์ผ ์ˆ˜๋„, ์กฐ๊ธˆ ๊ตฌ์กฐํ™”๋œ ์ƒํƒœ์ผ ์ˆ˜๋„, ํ˜น์€ ์ „ํ˜€ ๊ตฌ์กฐํ™”๋˜์ง€ ์•Š์€ ์ƒํƒœ์ผ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.(= can be constructed, semi-constructed, or not constructed) ๋น… ๋ฐ์ดํ„ฐ๋Š” ์ฃผ๋กœ ์—ฌ๋Ÿฌ๊ฐœ์˜ ์ปดํ“จํ„ฐ์— ๋‚˜๋ˆ„์–ด์ ธ์„œ ์ €์žฅ๋ฉ๋‹ˆ๋‹ค.์šฐ๋ฆฌ๊ฐ€ ํ‰์ƒ์‹œ์— ์ ‘ํ•˜๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ทœ๋ชจ์™€๋Š” ๋น„๊ต๋„ ์•ˆ๋˜๊ฒŒ ๋งค์šฐ ํฐ ๋ฐ์ดํ„ฐ๋กœ ์ธ์‹ํ•˜๋ฉด ๋  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋น… ๋ฐ์ดํ„ฐ์—๋Š” ์ „์ฒ˜๋ฆฌ๊ฐ€ ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.๋น…๋ฐ์ดํ„ฐ์˜ ์ „์ฒ˜๋ฆฌ์˜ ๋ช‡๊ฐ€์ง€ ์ข…๋ฅ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. Types of Pre-processing:1. Class Labeling (number, text, digital image, di..
Chan Lee
'Data Science/๊ฐœ๋…๊ณผ ์šฉ์–ด' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๊ธ€ ๋ชฉ๋ก (5 Page)