반응형
1. 지도 방식에 따른 유형
지도 학습 supervised learning
- 특징 벡터 𝕏와 목표치 𝕐 (정답 있음)가 모두 주어진 상황
- 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
- 회귀 regression와 분류 classification 문제로 구분
비지도 학습 unsupervised learning
- 특징 벡터 𝕏는 주어지는데 목표치 𝕐 가 주어지지 않는 상황 (정답 없음)
- 정답이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 것
- 군집화 clustering 과업 (고객 성향에 따른 맞춤 홍보 응용 등)
- 밀도 추정 density estimation, 특징 공간 변환 과업 (예. PCA)
- 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도 학습보다는 조금 더 난이도가 있음.
강화 학습 reinforcement learning
- (상대적) 목표치가 주어지는데, 지도 학습과 다른 형태임 (==보상 reward)
- 행동 심리학에서 나온 이론으로 분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 따로 정해져 있지 않으며 자신이 한 행동에 대해 보상(reward)을 받으며 학습하는 것을 말함.
- 예) 바둑
- 수를 두는 행위가 샘플인데, 게임이 끝나면 목표치 하나가 부여됨 – 이기면 1, 패하면 -1을 부여
- 게임을 구성한 샘플들 각각에 목표치를 나누어 주어야 함
준지도 학습 semi-supervised learning
- 일부만 𝕏와 𝕐를 모두 가지고, 나머지는 𝕏만 가진 상황
- 최근, 대부분의 데이터가 𝕏의 수집은 쉽지만, 𝕐는 수작업이 필요하여 최근 중요성 부각
- 목푯값을 포함한 데이터를 얻기 위해서는 훈련된 사람의 손을 거쳐야 하므로 그 비용이 감당할 수 없을 만큼 클 수 있음. 따라서 이 경우 준지도 학습을 사용하면 결과를 향상할 수 있음.
2. 다양한 기준에 따른 유형
오프라인 학습 offline learning과 온라인 학습 online learning
- 보통은 오프라인 학습을 다룸
- 온라인 학습은 IoT 등에서 추가로 발생하는 데이터 샘플을 가지고 점증적 학습 수행
- 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합
- 오프라인 학습은 시스템이 점진적으로 학습할 수 없음. 강용한 데이터를 모두 사용해 훈련시켜야 함. 즉, 학습한 것을 단지 적용
결정론적 학습 deterministic learning과 확률적 학습 stochastic learning
- 결정론적에서는 같은 데이터를 가지고 다시 학습하면 같은 예측 모델이 만들어짐
- 어떤 특정한 입력이 들어오면 언제나 똑같은 과정을 거쳐서 언제나 똑같은 결과를 내놓음.
- 확률적 학습은 학습 과정에서 확률 분포를 사용하므로 같은 데이터로 다시 학습하면 다른 예측 모델이 만들어짐
분별 모델 discriminative models과 생성 모델 generative models
- 분별 모델은 부류 예측에만 관심. 즉 P(y|x)의 추정에 관심
- x라는 데이터가 있을 때 이 데이터의 카테고리가 y 일 확률, 즉 P(y|x)만을 추정
- 생성 모델은 P(x) 또는 P(x|y)를 추정함
- x가 발생할 확률인 P(x)나 카테고리 y에서 x가 발생할 확률 P(x|y)를 명시적으로 계산
- 따라서 이 확률 정보를 이용하면 새로운 샘플을 ‘생성’할 수 있음.
참고
반응형
'Artificial intelligence' 카테고리의 다른 글
[AI] 검증집합과 교차검증을 이용한 모델 선택 알고리즘 / 데이터 확대와 가중치 감쇠 (2) | 2021.09.11 |
---|---|
[AI] 과소적합(underfitting)과 과잉적합(overfitting) / 바이어스(bias)와 분산(variance) (0) | 2021.09.10 |
[AI] Convex Optimization (볼록 최적화) / Convex, Non-Convex (0) | 2021.09.08 |
[AI] 선형 회귀 문제와 매개변수 최적화 관계 (0) | 2021.09.08 |
[AI] 데이터에 대한 이해 / 데이터 생성 과정 / 데이터의 중요성 / 데이터베이스 크기와 기계 학습 성능 / 데이터 가시화 (0) | 2021.09.08 |