Machine Learning (ML) ์ ๋ฌด์์ผ๊น์?๋จธ์ ๋ฌ๋์ ์ปดํจํฐ์๊ฒ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ์ ๊ฐ์ฅ ์ ํ์ฉ๋ ์ ์๋ ๋ถ์ ๋ชจ๋ธ์ ์ฐพ์ ์ ์๋๋ก ํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํด์ฃผ๊ณ , ์ปดํจํฐ์ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋งค์ฐ ์ ํํ ์์ธก์ ํ ์ ์๋ ์ผ๋ จ์ ๊ณผ์ ์ ๋งํฉ๋๋ค. ์ง๋ ํฌ์คํธ์์ ์ดํด๋ณธ ์ ํต์ ๋ฐฉ๋ฒ๋ค๊ณผ๋ ๋ค๋ฅด๊ฒ, ์ฐ๋ฆฌ๋ ์ปดํจํฐ์๊ฒ ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ ๋ณด๋ ์ฃผ์ง ์์ต๋๋ค.(์ฐ๋ฆฌ๋ ๋ชจ๋ฅด๋๊น์)์ฐ๋ฆฌ๊ฐ ์ปดํจํฐ์๊ฒ ์ฃผ๋ ๊ฒ์ ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค. ์ปดํจํฐ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ๋ชจ๋ธ์ ๋ฐ์ ์ํต๋๋ค.์ต์ ์ ๋ชจ๋ธ์ ์ฐพ๋ ํ์๋ ์ปดํจํฐ์ ๋ชซ์
๋๋ค.์ฌ๊ธฐ์ '์ต์ '์ ๊ธฐ์ค์ ์ด๋ป๊ฒ ์ ํ๋์ ๋ฐ๋ผ์ ํ์ต ๋ฐ๋ณต์ ํ์๊ฐ ๋ณํ๊ฒ ์ฃ ? ๋จธ์ ๋ฌ๋์ ๊ณผ์ ์ ์ฝ๊ฒ ์์ฝํ๋ฉด, Trial-and-Error ๊ณผ์ , ์ฆ ์๋์..
Data Science/๊ฐ๋ ๊ณผ ์ฉ์ด
์ง๋ ํฌ์คํธ๊น์ง ์ดํด๋ณด์๋ ํ์๋ค, data์ big data์ ์ฒ๋ฆฌ์ business intelligence๋ ๊ณผ๊ฑฐ์ ์ผ์ด๋ ์ผ๋ค์ ๋ถ์ํ๊ธฐ ์ํ ์งํฅ์ ์ ๊ฐ์ง ํ์๋ค์ด์์ต๋๋ค. ์ด๋ฒ ํฌ์คํธ์์๋ ์ด๋ฅผ ํตํด ๊ถ๊ทน์ ์ผ๋ก ์ฐ๋ฆฌ๊ฐ ๋ค๊ฐ๊ฐ๋ ค๊ณ ํ๋ ๋ฏธ๋ ๋ถ์ ์ค, ์ ํต์ ์ธ ๋ฐฉ๋ฒ๋ค์ ๋ํด์ ์๊ฐํ๊ฒ ์ต๋๋ค. Traditional Methods๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.A set of methods that are derived mainly from statistics and are adopted for business.Statistic, ์ฆ ์ํ ๋ฐ์ดํฐ์์ ๊ตฌํ ํต๊ณ์ ๊ฐ๋ค์ผ๋ก๋ถํฐ ์ ์ถ๋๊ณ , ๋น์ฆ๋์ค๋ค์ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ๋ค์ ์ด์นญํฉ๋๋ค. ์ด๋ฌํ traditional methods๋ ๋ฏธ๋์ ํผํฌ๋จผ์ค๋ฅผ ์์ธกํ๋๋ฐ ๋์ ..
Business Intelligence (BI)๋ ๋ฌด์์ผ๊น์?Business Intelligence, BI๋ ๊ณผ๊ฑฐ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ์, ์ดํด, ์ค๋ช
๋ฐ ๋ณด๊ณ ํ๋ ๊ณผ์ ์ ํฌํจ๋ ๋ชจ๋ tool์
๋๋ค.๋์ ๋น์ฆ๋์ค์ ๋งค์ถ์ด ์ฆ๊ฐํ์๋์ง, ๊ทธ๋ฆฌ๊ณ ์ ์ฆ๊ฐํ์๋์ง๋ฅผ ๋ถ์ํ๋ค๊ณ ์๊ฐํ๋ฉด ์ง๊ด์ ์
๋๋ค. ์ฐ๋ฆฌ๋ BI๋ฅผ ํตํด์ ์์ด๋์ด์ ํต์ฐฐ๋ ฅ์ ์ป๊ณ , ๋ฏธ๋์ ๊ฒฐ์ ์ ๋์์ ์ฃผ๊ธฐ๋ฅผ ์ํฉ๋๋ค. ์ค์ํ์ ์์๋ก๋, ์ฑ์๊ธฐ์ (์์๊ฐ ๋์ด๋๋ ์๊ธฐ์) ํธํ
๊ฐ๊ฒฉ์ ์ฌ๋ฆฌ๋ price optimization์ด ์๊ฒ ์ต๋๋ค.๊ณผ๊ฑฐ์ ์๋ฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ฐฉ์ ๊ฐ๊ฒฉ์ ์ต์ ํํ์ฌ ์์ต์ ์ต๋ํ ์ํค๋ ํ์๊ฐ ๋๊ฒ ์ต๋๋ค. BI๋ฅผ ๋์ฑ ์ดํดํ๊ธฐ ์ํด, ๋ช๊ฐ์ง ๊ฐ๋
๋ค์ ์๊ฐํ๊ฒ ์ต๋๋ค.Observation (๊ด์ฐฐ): ์ํ์ ์ผ๋ก ๋ค๋ฃจ์ด์ง ์ ์๋..
Big Data๋ Traditional Data์ ์๋ฐ๋๋ ๋ฐ์ดํฐ๋ค๋ก, ๋งค์ฐ ํฐ ๋ฐ์ดํฐ๋ค์ ์ง์นญํฉ๋๋ค.๋น
๋ฐ์ดํฐ๋ ๊ตฌ์กฐํ ๋ ์ํ์ผ ์๋, ์กฐ๊ธ ๊ตฌ์กฐํ๋ ์ํ์ผ ์๋, ํน์ ์ ํ ๊ตฌ์กฐํ๋์ง ์์ ์ํ์ผ ์๋ ์์ต๋๋ค.(= can be constructed, semi-constructed, or not constructed) ๋น
๋ฐ์ดํฐ๋ ์ฃผ๋ก ์ฌ๋ฌ๊ฐ์ ์ปดํจํฐ์ ๋๋์ด์ ธ์ ์ ์ฅ๋ฉ๋๋ค.์ฐ๋ฆฌ๊ฐ ํ์์์ ์ ํ๋ ๋ฐ์ดํฐ์ ๊ท๋ชจ์๋ ๋น๊ต๋ ์๋๊ฒ ๋งค์ฐ ํฐ ๋ฐ์ดํฐ๋ก ์ธ์ํ๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ด๋ฐ ๋น
๋ฐ์ดํฐ์๋ ์ ์ฒ๋ฆฌ๊ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค.๋น
๋ฐ์ดํฐ์ ์ ์ฒ๋ฆฌ์ ๋ช๊ฐ์ง ์ข
๋ฅ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. Types of Pre-processing:1. Class Labeling (number, text, digital image, di..