본문 바로가기

📚 분류 전체보기65

[AI] 선형 회귀 문제와 매개변수 최적화 관계 간단한 기계 학습의 예 선형 회귀 문제 식 y=wx + b 의 직선 모델(가설)을 사용하므로 두 개의 매개변수 θ = (w, b)^T 데이터를 살펴보았으니 이제는 그 데이터를 실제 학습해보자. 회귀라고 하는 것은 실수값인 y를 예측하는 과정이다. 선형회귀는 회귀문제에서 모델을 선형 즉, 직선의 형태로 놓고 문제를 푸는 것이다. 직선 모델은 매개값이 2개이다. 우리가 w,b를 어떻게 설정하느냐에 따라서 우리는 x,y의 상관관계 (규칙)를 명확하게 설명할 수도 있고 실패할 수도 있다. 목적 함수 (또는 비용 함수) 아래 식은 선형 회귀를 위한 목적 함수 평균 제곱오차(Mean square error function) 라 부름 𝑓θ(𝐱𝑖) 는 예측함수의 예측 출력, yi는 예측함수가 맞추어야 하는 실제 목표치.. 2021. 9. 8.
[AI] 데이터에 대한 이해 / 데이터 생성 과정 / 데이터의 중요성 / 데이터베이스 크기와 기계 학습 성능 / 데이터 가시화 데이터에 대한 이해 과학 기술의 정립 과정 예) Tycho Brache 는 천동설이라는 틀린 모델을 선택하여 수집한 데이터를 설명하지 못함 Johannes Kepler는 지동설 모델을 도입하여 제 1, 제 2, 제 3법칙을 완성함. 기계학습 기계학습은 복잡 문제/과업을 다룸 지능적 범주의 행위들은규칙의 다양한 변화 양상을 가짐 단순한 수학 공식으로 표현 불가능함 데이터를 설명할 수 있는 학습 모델을 찾아내는 과정 → 과학기술과 기계학습은 비슷한 모습을 보인다. → 과학기술이라고 하는 것 자체는 수학적인 공식에 의해서 표현을 한다. 하지만 기계학습이나 데이터과학이라고 하는 분야는 단순한 수학 모델에 의해 표현이 불가능하며, 규칙을 찾는다던지 학습을 통해서 해결을 하려고 하는 과정이다. → 기계학습이라고 하.. 2021. 9. 8.
[HW] CPU, GPU, TPU 비교 CPU (Central Processing Unit) 컴퓨터의 정중앙에서 모든 데이터를 처리하는 장치이다. ALU가 한 개이다. CPU 에는 제어장치(CU)가 존재하는 대신, ALU 가 1개 뿐이다. 따라서, 단순 사칙연산 속도는 GPU 에 비해 안 좋으나, 복잡한 연산에는 용이하다. GPU (Graphics Processing Unit) GPU는 컴퓨터 그래픽을 처리하는 장치로, 그래픽 카드를 구성하는 가장 중요한 요소이다. 3D 그래픽의 각종 광원 효과 및 질감 표현기법 등이 발전하면서 이를 CPU 혼자 처리하기에 버거워져 보조하기 위해 개발되었다. 하지만, 현재는 딥 러닝 영역에서 컴퓨팅 워크로드를 가속화하기 위해, 보다 광범위하게 활용되고 있다. ALU가 약 2500개이다. ALU 의 개수가 CP.. 2021. 9. 7.
[AI] 인공지능과 특징공간 / 표현학습과 심층학습 특징 공간 모든 데이터는 정량적으로 표현되며, 특징 공간 상에 존재한다. 정량화되었다? 벡터나 행렬의 형태로 표현이 가능하다. 1차원 특징 공간 2차원 특징 공간 - 특징 벡터 표기 d-차원 특징 공간 특징벡터 표기 d-차원 데이터를 위한 학습 모델의 예 직선 모델을 사용하는 경우 매개변수 수 = d+1 2차 곡선 모델을 사용하면 매개변수 수가 지수적으로 증가, 매개변수 수 = d^2+d+1 Iris 데이터는 d=4이므로 21개의 매개변수 MNIST 데이터는 d=784이므로 615,441개의 매개변수 거리 : 차원에 무관하게 수식 적용 가능함. 두 점 사이의 유클리드 거리는 모든 d에 성립 → 거리가 가까우면 data 유사도 판별 및 거리 정보가 중요하다. 특징 공간 변환과 표현 학습 차원의 저주 차원이.. 2021. 9. 7.