본문 바로가기

Artificial intelligence

[AI] 기계 학습 유형

by @__100.s 2021. 9. 10.

1. 지도 방식에 따른 유형

지도 학습 supervised learning

특징 벡터 𝕏와 목표치 𝕐 (정답 있음)가 모두 주어진 상황
- 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
회귀 regression와 분류 classification 문제로 구분

비지도 학습 unsupervised learning

특징 벡터 𝕏는 주어지는데 목표치 𝕐 가 주어지지 않는 상황 (정답 없음)
- 정답이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 것
군집화 clustering 과업 (고객 성향에 따른 맞춤 홍보 응용 등)
밀도 추정 density estimation, 특징 공간 변환 과업 (예. PCA)
라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도 학습보다는 조금 더 난이도가 있음.

강화 학습 reinforcement learning

(상대적) 목표치가 주어지는데, 지도 학습과 다른 형태임 (==보상 reward)
- 행동 심리학에서 나온 이론으로 분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 따로 정해져 있지 않으며 자신이 한 행동에 대해 보상(reward)을 받으며 학습하는 것을 말함.
예) 바둑
- 수를 두는 행위가 샘플인데, 게임이 끝나면 목표치 하나가 부여됨 – 이기면 1, 패하면 -1을 부여
- 게임을 구성한 샘플들 각각에 목표치를 나누어 주어야 함

준지도 학습 semi-supervised learning

일부만 𝕏와 𝕐를 모두 가지고, 나머지는 𝕏만 가진 상황
최근, 대부분의 데이터가 𝕏의 수집은 쉽지만, 𝕐는 수작업이 필요하여 최근 중요성 부각
- 목푯값을 포함한 데이터를 얻기 위해서는 훈련된 사람의 손을 거쳐야 하므로 그 비용이 감당할 수 없을 만큼 클 수 있음. 따라서 이 경우 준지도 학습을 사용하면 결과를 향상할 수 있음.

2. 다양한 기준에 따른 유형

오프라인 학습 offline learning과 온라인 학습 online learning

보통은 오프라인 학습을 다룸
온라인 학습은 IoT 등에서 추가로 발생하는 데이터 샘플을 가지고 점증적 학습 수행
- 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합
오프라인 학습은 시스템이 점진적으로 학습할 수 없음. 강용한 데이터를 모두 사용해 훈련시켜야 함. 즉, 학습한 것을 단지 적용

결정론적 학습 deterministic learning과 확률적 학습 stochastic learning

결정론적에서는 같은 데이터를 가지고 다시 학습하면 같은 예측 모델이 만들어짐
- 어떤 특정한 입력이 들어오면 언제나 똑같은 과정을 거쳐서 언제나 똑같은 결과를 내놓음.
확률적 학습은 학습 과정에서 확률 분포를 사용하므로 같은 데이터로 다시 학습하면 다른 예측 모델이 만들어짐

분별 모델 discriminative models과 생성 모델 generative models

분별 모델은 부류 예측에만 관심. 즉 P(y|x)의 추정에 관심
- x라는 데이터가 있을 때 이 데이터의 카테고리가 y 일 확률, 즉 P(y|x)만을 추정
생성 모델은 P(x) 또는 P(x|y)를 추정함
- x가 발생할 확률인 P(x)나 카테고리 y에서 x가 발생할 확률 P(x|y)를 명시적으로 계산
- 따라서 이 확률 정보를 이용하면 새로운 샘플을 ‘생성’할 수 있음.

참고

'Artificial intelligence' 카테고리의 다른 글

[AI] 검증집합과 교차검증을 이용한 모델 선택 알고리즘 / 데이터 확대와 가중치 감쇠 (2)	2021.09.11
[AI] 과소적합(underfitting)과 과잉적합(overfitting) / 바이어스(bias)와 분산(variance) (0)	2021.09.10
[AI] Convex Optimization (볼록 최적화) / Convex, Non-Convex (0)	2021.09.08
[AI] 선형 회귀 문제와 매개변수 최적화 관계 (0)	2021.09.08
[AI] 데이터에 대한 이해 / 데이터 생성 과정 / 데이터의 중요성 / 데이터베이스 크기와 기계 학습 성능 / 데이터 가시화 (0)	2021.09.08

티스토리툴바