일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 문자열
- C++
- string
- Pre-processing
- 배열
- assignment operator
- const
- OOP
- predictive analysis
- function
- pointer
- 알고리즘
- array
- 포인터
- Object Oriented Programming
- raw data
- 파이썬
- Python
- 백준
- Data Science
- programming
- pass by reference
- 티스토리챌린지
- 오블완
- Class
- vscode
- 함수
- Deep Learning
- 반복문
- baekjoon
- Today
- Total
목록Data Science/개념과 용어 (22)
Channi Studies

There are two types of predictions in data science. Regression은 numerical data를 예측하는데 사용하고, Classification 은 cateogorical data를 예측하는데 사용합니다. 예를 들어, 우리가 사용하는 이메일의 스팸 메일함이 있습니다.메일의 텍스트 데이터를 기반으로 스팸인지 아닌지, Yes or No 에 해당하는 Cateogorical variable을 예측합니다. Input = Text / Output = Yes or No (Spam, Not Spam) Classification에 대해서 더 자세히 알아보기 이전, 간단하게 Machine Learning에 대해서 알아보겠습니다. Machine Learning Algorit..

In a simple linear regression line (LMS), the regression line can be expressed as following equation:y = ax + bwherey = The variable that you want to predict (예측하고 싶은 값) | Dependent variable (종속 변수)x = The variable that you are using to predict (예측에 사용하는 값) | Independent variable (독립 변수)a = Slope (기울기)b = y-intercept (y 절편) 그렇다면, y = ax+b 에서 slope(a)와 y-intercept(b)는 어떻게 구하는지 알아보겠습니다. Recall, r ..

When there are two numerical variables, there are TrendPositive associationNegative association PatternAny discernible "shape" in the scatterLinear Non-linear Visualize, then quantify The Correlation Coefficient rMeasures linear association. It is based on the standard units. r is defined as:The average of product of (x in standard units) and (y in standard units) 표준 단위 x와 표준 단위 y의 곱의 평균 In P..
Confidence Interval is the interval of estimates of a parameter.It's based on random sampling. 가장 널리 사용되는 것은 95% Confidence Interval 입니다. Here, '95%' is called the confidence level.it could be any percent between 0 - 100.Higher confidence level means wider intervals. Confidence interval can be considered 'Good' if it contains the parameter.The confidence is in the process that creates the inter..