본문 바로가기
Artificial intelligence

[AI] 기계 학습 유형

by @__100.s 2021. 9. 10.
반응형

1. 지도 방식에 따른 유형

지도 학습 supervised learning

  • 특징 벡터 𝕏와 목표치 𝕐 (정답 있음)가 모두 주어진 상황
    • 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
  • 회귀 regression와 분류 classification 문제로 구분

비지도 학습 unsupervised learning

  • 특징 벡터 𝕏는 주어지는데 목표치 𝕐 가 주어지지 않는 상황 (정답 없음)
    • 정답이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 것
  • 군집화 clustering 과업 (고객 성향에 따른 맞춤 홍보 응용 등)
  • 밀도 추정 density estimation, 특징 공간 변환 과업 (예. PCA)
  • 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도 학습보다는 조금 더 난이도가 있음.

강화 학습 reinforcement learning

  • (상대적) 목표치가 주어지는데, 지도 학습과 다른 형태임 (==보상 reward)
    • 행동 심리학에서 나온 이론으로 분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 따로 정해져 있지 않으며 자신이 한 행동에 대해 보상(reward)을 받으며 학습하는 것을 말함.
  • 예) 바둑
    • 수를 두는 행위가 샘플인데, 게임이 끝나면 목표치 하나가 부여됨 – 이기면 1, 패하면 -1을 부여
    • 게임을 구성한 샘플들 각각에 목표치를 나누어 주어야 함

준지도 학습 semi-supervised learning

  • 일부만 𝕏𝕐를 모두 가지고, 나머지는 𝕏만 가진 상황
  • 최근, 대부분의 데이터가 𝕏의 수집은 쉽지만, 𝕐는 수작업이 필요하여 최근 중요성 부각
    • 목푯값을 포함한 데이터를 얻기 위해서는 훈련된 사람의 손을 거쳐야 하므로 그 비용이 감당할 수 없을 만큼 클 수 있음. 따라서 이 경우 준지도 학습을 사용하면 결과를 향상할 수 있음.

2. 다양한 기준에 따른 유형

오프라인 학습 offline learning과 온라인 학습 online learning

  • 보통은 오프라인 학습을 다룸
  • 온라인 학습은 IoT 등에서 추가로 발생하는 데이터 샘플을 가지고 점증적 학습 수행
    • 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합
  • 오프라인 학습은 시스템이 점진적으로 학습할 수 없음. 강용한 데이터를 모두 사용해 훈련시켜야 함. 즉, 학습한 것을 단지 적용

결정론적 학습 deterministic learning과 확률적 학습 stochastic learning

  • 결정론적에서는 같은 데이터를 가지고 다시 학습하면 같은 예측 모델이 만들어짐
    • 어떤 특정한 입력이 들어오면 언제나 똑같은 과정을 거쳐서 언제나 똑같은 결과를 내놓음.
  • 확률적 학습은 학습 과정에서 확률 분포를 사용하므로 같은 데이터로 다시 학습하면 다른 예측 모델이 만들어짐

분별 모델 discriminative models과 생성 모델 generative models

  • 분별 모델은 부류 예측에만 관심. 즉 P(y|x)의 추정에 관심
    • x라는 데이터가 있을 때 이 데이터의 카테고리가 y 일 확률, 즉 P(y|x)만을 추정
  • 생성 모델은 P(x) 또는 P(x|y)를 추정함
    • x가 발생할 확률인 P(x)나 카테고리 y에서 x가 발생할 확률 P(x|y)를 명시적으로 계산
    • 따라서 이 확률 정보를 이용하면 새로운 샘플을 ‘생성’할 수 있음.

참고

반응형