반응형
- 오감 중에 시각은 가장 강력한 인지 기능
- 컴퓨터 비전은 컴퓨터를 이용하여 시각 기능을 갖는 기계 장치를 만드는 기술 분야
컴퓨터 비전 computer vision 이란?
- 카메라를 통하여 입력된 사진/동영상을 컴퓨터가 이해하기 위한 분야
컴퓨터 비전의 목표
- 픽셀 pixel로부터 의미 있는 정보 추출
- 사람은 사진의 내용을 추론하여 이해할 수 있다. 마찬가지로 컴퓨터에게 숫자 정보가 주어졌을 때, 그 숫자 정보를 이해하고 분류할 수 있는 능력을 키우게 하려는 것
어떤 정보를 영상으로부터 검출할 수 있는가?
- 주어진 영상으로 부터 카메라가 추출하고자 하는 정보는 의미론적 정보와 사진의 구조적 정보이다.
- 의미론적 정보 ) 주어진 영상에서 각각의 여러 영역들이 어떤 객체로 구성되어 있는지에 대해 인식하는 과정
- 구조적 정보 ) 3차원 정보가 어떤 식으로 이루어지고 있는지를 이해하는 것
컴퓨터 비전 문제는 어떻게 해결하나?
- 사람의 시각은 빠르고 매우 강건하다.
- 컴퓨터로 사람 수준을 달성하는 목표는 현재 기술로 불가능하다.
과학적 접근과 공학적 접근
과학적 접근
- 사람의 시각에 맞먹는 인공 시각을 만든다.
공학적 접근
- 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다.
→ 특정한 상황에서 특정 임무를 수행하는 실용 시스템을 구축하려는 노력을 해야 한다.
→ 많은 응용 현장에서 쓰이거나 컴퓨터 비전이 사람보다 뛰어난 경우 성공적인 시스템이라고 한다.
계층적 처리
- 전처리 ) 주로 영상 처리
- 특징 추출 ) 에지, 선분, 영역, 텍스처, 지역 특징 등을 검출하고 특징 벡터 추출
- 해석 ) 응용에 따라 다양한 형태
저급 비전 low level processing ) 주어진 영상으로부터 의미 있는 정보를 추출하는 과정
고급 비전 high level processing ) 추출된 정보로 인식, 추정, 분류, 구분하는 것
컴퓨터 비전에서 해결해야 할 문제
- Viewpoint variation ) 컴퓨터는 어떻게 보느냐에 따라서 인식을 못할 수 있다.
- Illumination ) 똑같은 물체이더라도 조명환경에 따라서 들어오는 정보가 다르다.
- Scale ) 동일한 물체를 보더라도 어떤 스케일에서 보느냐에 따라 들어오는 정보가 다르다.
- Deformation ) 많은 객체들이 고정된 형태가 없고, 극단적인 형태로 변형되더라도 그 물체에 대해서 강건하게 이해할 수 있어야 한다.
- Occlusion, clutter ) 물체가 가려져 있거나 일부분만 보인다고 하더라도 이해할 수 있어야 한다.
- Motion ) 움직임이 있는 경우에도 특성을 이해하고 특징을 뽑을 수 있어야 한다.
- Object intra-class variation ) 분류해야 할 클래스의 범위가 큰 것들이 많다. 예를 들어 의자의 경우 다양한 형태의 객체가 있다.
- Local ambiguity ) 사진의 대한 정보가 애매모호하더라도 물체가 무엇인지 예측할 수 있어야 한다.
- Inherent ambiguity ) 트릭 미술관 같은 3차원 트릭에 대해서도 이해할 수 있어야 한다.
해결방안
- Linear perspective ) 선의 정보를 이용해 앞 뒤를 구분한다.
- Aerial perspective ) 영역에 대한 투영이 달라지는 정보를 가지고 구분한다.
- Texture gradient ) 물체가 가진 질감 정보를 이용해 문제를 해결한다.
- Shading ) 명암으로부터 나오는 정보를 통해 문제를 해결한다.
- Cast Shadows ) 그림자로부터 나오는 정보를 통해 문제를 해결한다.
- Similarity (color, texture, proximity) ) 색상 정보, 질감, 등을 이용해 물체를 구분하고 이해한다.
- Common fate ) 물체가 가진 모양에 대한 이해로 문제를 해결한다.
반응형
'Computer vision' 카테고리의 다른 글
[Computer vision] 컨볼루션 Convolution이란? (0) | 2021.09.23 |
---|---|
[Computer vision] 05. 이진영상 (0) | 2021.09.16 |
[Computer vision] 04. 히스토그램 (0) | 2021.09.13 |
[Computer vision] 03. 컬러 (0) | 2021.09.09 |
[Computer vision] 02. 카메라 모델 / 영상 처리 (0) | 2021.09.01 |