ํ๋ฅ ์ด๋ ๊ทธ ์ ์์์ ์ด๋ฏธ ์์๋ค์ํผ, ์ด๋ค ํน์ ์ด๋ฒคํธ x๊ฐ ๋ฐ์ํ ๊ฐ๋ฅ์ฑ์ ์ซ์๋ก ๋ํ๋ธ ๊ฒ ์
๋๋ค.์ฐ๋ฆฌ๋ ๋ฏธ๋์ ๋ฒ์ด์ง ์ผ์ ํ๋ฅ ๋ค์ ์์ ์ผ๋ก ๋น๊ตํด์, ๋์ฑ ๋์ ํ๋ฅ ์ด ์ด๋ค ๊ฒ ์ธ์ง๋ฅผ ์์๋์ผ๋ก์จ ๋ฏธ๋๋ฅผ ์์ธกํ๊ณ ์ ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ ํ ์ฌ๊ฑด x๊ฐ ์ ๋๋ก ๋ฐ์ํ์ง ์๋๋ค๋ ๊ฒ์ ํ๋ฅ ์ด 0์ด๋ค. ๋ผ๊ณ ํํํฉ๋๋ค.๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ ์ด๋ ํ ์ฌ๊ฑด x๊ฐ ๋ฌด์กฐ๊ฑด ๋ฐ์ํ๋ค๋ ๊ฒ์ ํ๋ฅ ์ 1์ด๋ค. ๋ผ๊ณ ํํํฉ๋๋ค.์ฆ ๋ชจ๋ ํ๋ฅ ์ 0~1์ ๊ฐ์ ๊ฐ์ง๊ณ , ๋ณดํต ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ๋ 0๊ณผ 1์ ์๋๊ฒ ์ฃ ? ๊ณ์ฐ๊ณผ ๋น๊ต์ ํธ์์ฑ์ ์ํด, ์ฐ๋ฆฌ๋ 30%, 1/5, ์ด๋ฐ ์๋ก ํ๋ฅ ์ ํํํ๊ธฐ๋ณด๋ค 0.2, 0.53๊ณผ ๊ฐ์ ์์๋ก ํํํ๊ธฐ๋ฅผ ์ ํธํฉ๋๋ค. ํน์ ์ด๋ฒคํธ x์ ๋ํด์ ์ฐ๋ฆฌ๋,x๊ฐ ์ผ์ด๋ ํ๋ฅ ์ P(x)๋ก ํ๊ธฐํ๊ณ ,P(x)..
Data Science
Data Scientist๊ฐ ํ๋ ์ผ์ ๋ ์ ์ดํดํ๊ธฐ ์ํด์, Data ์ ๊ด๋ จ๋ ์ฌ๋ฌ ์ง์
๋ค์ ํจ๊ป ์์๋ณด๊ฒ ์ต๋๋ค. Data ArchitectData architect๋ ์ฌ์ฉ๋ ๋ฐ์ดํฐ์
์ ์ฒ์๋ถํฐ ๋์์ธํด ๋๊ฐ๋๋ค.๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ฐฉ์์ผ๋ก ํ์๋๊ณ ์ฌ์ฉ๋๊ณ ๋ถ์๋ ์ง๋ฅผ ๊ตฌ์ํฉ๋๋ค. Data Engineer๋ฐ์ดํฐ ์์ง๋์ด๋ ํ๋๋ ๋ฐ์ดํฐ(raw data)๋ฅผ ์ฒ๋ฆฌ(processing)ํ์ฌ ๋ถ์(analysis)์ ์ฌ์ฉ๋ ์ ์๊ฒ๋ ํฉ๋๋ค.๋ฐ์ดํฐ ์์ง๋์ด๊ฐ ์ฒ๋ฆฌ๋ฅผ ๋ง์น ๋ฐ์ดํฐ์
์ ๋ฐ์ดํฐ ๋ถ์๊ณผ ๊ด๋ จ๋ ์
๋ฌด๋ฅผ ๋งก๋ ์ฌ๋๋ค์๊ฒ ๋๊ฒจ์ง๋๋ค.๊นจ๋ํ๊ณ ์ ๋ฆฌ๋ ๋ฐ์ดํฐ์
์ ๋ง๋๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. Data Administrator๋ฐ์ดํฐ ๊ด๋ฆฌ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ฐ์ดํฐ์ ํ๋ฆ (์ถ๊ฐ์ ์ ๊ฑฐ)๋ฅผ ๊ด๋ฆฌํฉ๋๋ค.๋ถ์์ ์ฌ์ฉ๋๋ ๋ฐ์ด..
๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ๋ถ์ผ์์๋ ๋ค์ํ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ์ํํธ์จ์ด๋ค์ด ์ฌ์ฉ๋ฉ๋๋ค. Programming Languagesํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ํ์ฉ์ ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๊ฐ ์ํ๋ ํ๋ก๊ทธ๋จ์ ์ง์ ๊ตฌํํ ์ ์๋๋ก ๋์์ค๋๋ค.์ ๊ฐ ๋ธ๋ก๊ทธ์์ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ๊ณต๋ถ๋ฅผ ์ํด ์ฌ์ฉํ๊ฒ ๋ ํ์ด์ฌ์ด ๊ฐ์ฅ ๋ํ์ ์ด๋ผ๊ณ ํ ์ ์๊ฒ ๋ค์. ํ์ฌ ์ธ๊ณ์ ์ผ๋ก ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ Python๊ณผ R์
๋๋ค.์ด ๋๊ฐ์ง ์ธ์ด์ ๊ฐ์ฅ ํฐ ์ฅ์ ์ ๋งค์ฐ ์ ์ฐํ์ฌ ์ฌ๋ฌ๊ฐ์ง ์ํฉ์ ๋ํ ๋ถ์์ ์์ฐ๋ฅผ ์ ์๋ค๋ ๊ฒ ์
๋๋ค.ํนํ ์ํ์ , ํต๊ณํ์ ์ฐ์ฐ์ ๋ฐ์ด๋ฉ๋๋ค. ํ์ง๋ง, ๋ฐ๋ฉด ํน์ ๋ฌธ์ ๋ค์ ๋ํด์๋ ๋ถ์ํ ์ ์๋ ๊ฒฝ์ฐ๋ ์กด์ฌํฉ๋๋ค.SQL์ relational database๋ฅผ ๊ด๋ฆฌ ์์คํ
์ ์ฌ์ฉํ ๋ ํ์ฉํ๋..
Machine Learning (ML) ์ ๋ฌด์์ผ๊น์?๋จธ์ ๋ฌ๋์ ์ปดํจํฐ์๊ฒ ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ์ ๊ฐ์ฅ ์ ํ์ฉ๋ ์ ์๋ ๋ถ์ ๋ชจ๋ธ์ ์ฐพ์ ์ ์๋๋ก ํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ํด์ฃผ๊ณ , ์ปดํจํฐ์ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋งค์ฐ ์ ํํ ์์ธก์ ํ ์ ์๋ ์ผ๋ จ์ ๊ณผ์ ์ ๋งํฉ๋๋ค. ์ง๋ ํฌ์คํธ์์ ์ดํด๋ณธ ์ ํต์ ๋ฐฉ๋ฒ๋ค๊ณผ๋ ๋ค๋ฅด๊ฒ, ์ฐ๋ฆฌ๋ ์ปดํจํฐ์๊ฒ ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ ๋ณด๋ ์ฃผ์ง ์์ต๋๋ค.(์ฐ๋ฆฌ๋ ๋ชจ๋ฅด๋๊น์)์ฐ๋ฆฌ๊ฐ ์ปดํจํฐ์๊ฒ ์ฃผ๋ ๊ฒ์ ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํ ์๊ณ ๋ฆฌ์ฆ์
๋๋ค. ์ปดํจํฐ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ๋ชจ๋ธ์ ๋ฐ์ ์ํต๋๋ค.์ต์ ์ ๋ชจ๋ธ์ ์ฐพ๋ ํ์๋ ์ปดํจํฐ์ ๋ชซ์
๋๋ค.์ฌ๊ธฐ์ '์ต์ '์ ๊ธฐ์ค์ ์ด๋ป๊ฒ ์ ํ๋์ ๋ฐ๋ผ์ ํ์ต ๋ฐ๋ณต์ ํ์๊ฐ ๋ณํ๊ฒ ์ฃ ? ๋จธ์ ๋ฌ๋์ ๊ณผ์ ์ ์ฝ๊ฒ ์์ฝํ๋ฉด, Trial-and-Error ๊ณผ์ , ์ฆ ์๋์..