K-MOOC '실습으로 배우는 머신러닝' 김영훈 교수님
Ch1. 개념, GPU, MSE, Linear Regression, minimize loss function, model validation
1-1. 인공지능과 머신러닝 개요
머신러닝 : 기계가 학습. 인공 지능을 구현하는 한 가지의 방법
- 함수를 학습
- 강아지와 고양이를 구분하는 함수를 찾는다.
- ex) 암진단, 자율주행 안전도 검증
과거의 AI : Knowledge Engineering
최근 AI : 컴퓨터 스스로 학습(Training) - 함수 - 컴퓨터가 문제 해결, Solving(Testing)
vision, language, speech(OK구글)
Artificial Intelligence > Machine Learning > Deep Learning
머신러닝이 각광 받는 이유?
- 빅데이터 시대
- 매 60초마다 트윗, 트위터, 이메일 등등
분산화 된 컴퓨팅 발전
- CPU Computing : 기본적인 연산과 분석을 해주는 컴퓨터
- 스마일 그림을 그리기 위해서 점을 찍어 나감
- 한 번에 하나씩(GPU에 상대적으로)
- GPU Computing : 그래피컬한 연산, 빠르게 처리 가능, Deep Learning의 발전을 가속화 시키는 것에 크게 기여
- 와..모나리자 그림
- 여러 개의 task를 한 번에
머신러닝이란?
- Environment(E)
- 머신러닝 알고리즘에 경험을 제공
- 경험 == Data
- Data(D)
- 기억해야 하는 패턴들이 모아져 있는 결과
- Model(M)
- 함수
- Performance(P)
적절한 함수?
y=f(x) : input, output
오차가 작은 것이 적절한 함수. ex) MSE(yi=실제-yi모델예측)^2
MSEa = 1/3{(10-11)^2 + (5-4)^2 + (7-8)^2}
1-2. 머신러닝 '학습' 개념
Linear Regression
- 전제 : input과 output이 linear relationship
- x는 하나의 변수, 최종적으로 출력되는 것 yhat, 베타는 회귀계수
- MSE : 제곱을 하면 +, - 오차들이 상쇄됨
- 최적화 : 함수를 최소화해주는 베타를 찾는다.
- Training error
1-3. 머신러닝 프로세스 및 활용
머신러닝의 category
Supervised Learning : Classification, Regression
Unsupervised Learning : Clustering
Reinforcement Learning(강화학습)
- Markov Decision Process, DQN, Policy Gradient
- ex. 알파고
Supervised Learning
output(y) 가 categorical : classification
output(y) 가 continuous : regression
Minimize loss function
대략적으로(hueristic)
- K_Nearest Neighbor
- Decision Tree
정확하게, 수학적으로(Numerical Optimization)
- Linear Regression
- Logistic Regression : classification 변형
- Support Vector Machine
- Neural Network(Deep Learning)
에러를 최소화(minimize validation error) == 적절한 모델 찾기 == 하이퍼파라미터 조정으로 적합한 모델 찾기
Model Validation with Data
댓글