본문 바로가기

📚 분류 전체보기65

[AI] 과소적합(underfitting)과 과잉적합(overfitting) / 바이어스(bias)와 분산(variance) 과소적합 underfitting 모델의 ‘용량이 작아’ 오차가 클 수밖에 없는 현상 더 높은 차원의 다항식, 즉 비선형 모델을 사용하여 해결할 수 있음. 과잉적합 overfitting 12차 다항식 곡선을 채택한다면 훈련집합에 대해 거의 완벽하게 근사화함 하지만 ‘새로운’ 데이터를 예측한다면 큰 문제 발생 예) x0에서 빨간 막대 근방을 예측해야 하지만 빨간 점을 예측 이유는 ‘모델의 용량capacity이 크기’ 때문에 학습 과정에서 잡음까지 수용 → 과잉적합 현상 훈련집합에 과몰입해서 단순 암기했기 때문임 적절한 용량의 모델을 선택하는 모델 선택 작업이 필요함 일반적으로 학습 데이터의 양이 충분하지 않은 경우, 특히 모델의 매개변수 수보다 적은 수의 데이터를 사용하는 경우 과잉적합이 쉽게 발생함. 학습.. 2021. 9. 10.
[AI] 기계 학습 유형 1. 지도 방식에 따른 유형 지도 학습 supervised learning 특징 벡터 𝕏와 목표치 𝕐 (정답 있음)가 모두 주어진 상황 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 회귀 regression와 분류 classification 문제로 구분 비지도 학습 unsupervised learning 특징 벡터 𝕏는 주어지는데 목표치 𝕐 가 주어지지 않는 상황 (정답 없음) 정답이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 것 군집화 clustering 과업 (고객 성향에 따른 맞춤 홍보 응용 등) 밀도 추정 density estimation, 특징 공간 변환 과업 (예. PCA) 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도 학.. 2021. 9. 10.
[Computer vision] 03. 컬러 컬러는 절대적인 값이 아니라, 물리적인 빛(태양빛이나 조명환경)과 시각 시스템(눈이나 카메라의 CCD나 Simons sensor)의 상호작용 결과이다. 색상은 우리가 사물과 빛을 볼 때 시각적 경험의 심리적 속성이지, 그 사물이나 빛의 물리적 속성이 아니다. 굉장히 상대적인 정보고 환경에 따라 달라질 수 있다. 심리적으로 작용된다. 우리가 가진 색상 정보는 매우 부정확할 수 있기 때문에 패턴을 사용할 때 주의해야 한다. 컬러의 양, 세기에 대해 정확하게 나타낼 수 있는 함수는 존재하지 않는다. 하지만 이에 대해 좀 더 정량적으로 나타내기 위해 사람들이 노력하고 있다. HSV(B) 가우시안 분포 ) 도수 분포의 그래프가 평균값을 중심으로 하여 좌우가 완벽한 대칭을 이루는 것 H, S, V(B) 세 가지 조.. 2021. 9. 9.
[AI] Convex Optimization (볼록 최적화) / Convex, Non-Convex Convex란? Convex란 '볼록한'이라는 뜻으로 수학에서 Convex를 대상이 집합(set)인지, 함수(function)인지에 따라 개념이 다르다. Convex Optimization은 목적함수 및 제약 조건 함수가 Convex Function 에 속하며, 동시에 문제의 범위에 해당하는 Domain이 Convex Set으로 정의된 경우에 해당한다. Convex Function 흔히 우리가 볼록 함수라고 말하는 함수이다. 아래로 볼록한 함수만 Convex function 이라고 한다. 위로 볼록한 함수는 아래로는 '오목'한 함수이므로 Concave function이라고 한다. 함수 위의 임의의 두 점을 연결하는 선을 그래프에 그었을 때, 그 선이 아래 그림과 같이 함수 그.. 2021. 9. 8.