본문 바로가기
Computer vision

[Computer vision] 01. 컴퓨터 비전이란?

by @__100.s 2021. 8. 31.
반응형
  • 오감 중에 시각은 가장 강력한 인지 기능
  • 컴퓨터 비전은 컴퓨터를 이용하여 시각 기능을 갖는 기계 장치를 만드는 기술 분야

컴퓨터 비전 computer vision 이란?

  • 카메라를 통하여 입력된 사진/동영상을 컴퓨터가 이해하기 위한 분야

컴퓨터 비전의 목표

  • 픽셀 pixel로부터 의미 있는 정보 추출
  • 사람은 사진의 내용을 추론하여 이해할 수 있다. 마찬가지로 컴퓨터에게 숫자 정보가 주어졌을 때, 그 숫자 정보를 이해하고 분류할 수 있는 능력을 키우게 하려는 것

어떤 정보를 영상으로부터 검출할 수 있는가?

  • 주어진 영상으로 부터 카메라가 추출하고자 하는 정보는 의미론적 정보와 사진의 구조적 정보이다.
  • 의미론적 정보 ) 주어진 영상에서 각각의 여러 영역들이 어떤 객체로 구성되어 있는지에 대해 인식하는 과정
  • 구조적 정보 ) 3차원 정보가 어떤 식으로 이루어지고 있는지를 이해하는 것

컴퓨터 비전 문제는 어떻게 해결하나?

  • 사람의 시각은 빠르고 매우 강건하다.
  • 컴퓨터로 사람 수준을 달성하는 목표는 현재 기술로 불가능하다.

과학적 접근과 공학적 접근

과학적 접근

  • 사람의 시각에 맞먹는 인공 시각을 만든다.

공학적 접근

  • 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다.

→ 특정한 상황에서 특정 임무를 수행하는 실용 시스템을 구축하려는 노력을 해야 한다.
→ 많은 응용 현장에서 쓰이거나 컴퓨터 비전이 사람보다 뛰어난 경우 성공적인 시스템이라고 한다.

계층적 처리

  • 전처리 ) 주로 영상 처리
  • 특징 추출 ) 에지, 선분, 영역, 텍스처, 지역 특징 등을 검출하고 특징 벡터 추출
  • 해석 ) 응용에 따라 다양한 형태

저급 비전 low level processing ) 주어진 영상으로부터 의미 있는 정보를 추출하는 과정

고급 비전 high level processing ) 추출된 정보로 인식, 추정, 분류, 구분하는 것

컴퓨터 비전에서 해결해야 할 문제

  • Viewpoint variation ) 컴퓨터는 어떻게 보느냐에 따라서 인식을 못할 수 있다.
  • Illumination ) 똑같은 물체이더라도 조명환경에 따라서 들어오는 정보가 다르다.
  • Scale ) 동일한 물체를 보더라도 어떤 스케일에서 보느냐에 따라 들어오는 정보가 다르다.
  • Deformation ) 많은 객체들이 고정된 형태가 없고, 극단적인 형태로 변형되더라도 그 물체에 대해서 강건하게 이해할 수 있어야 한다.
  • Occlusion, clutter ) 물체가 가려져 있거나 일부분만 보인다고 하더라도 이해할 수 있어야 한다.
  • Motion ) 움직임이 있는 경우에도 특성을 이해하고 특징을 뽑을 수 있어야 한다.
  • Object intra-class variation ) 분류해야 할 클래스의 범위가 큰 것들이 많다. 예를 들어 의자의 경우 다양한 형태의 객체가 있다.
  • Local ambiguity ) 사진의 대한 정보가 애매모호하더라도 물체가 무엇인지 예측할 수 있어야 한다.
  • Inherent ambiguity ) 트릭 미술관 같은 3차원 트릭에 대해서도 이해할 수 있어야 한다.

해결방안

  • Linear perspective ) 선의 정보를 이용해 앞 뒤를 구분한다.
  • Aerial perspective ) 영역에 대한 투영이 달라지는 정보를 가지고 구분한다.
  • Texture gradient ) 물체가 가진 질감 정보를 이용해 문제를 해결한다.
  • Shading ) 명암으로부터 나오는 정보를 통해 문제를 해결한다.
  • Cast Shadows ) 그림자로부터 나오는 정보를 통해 문제를 해결한다.
  • Similarity (color, texture, proximity) ) 색상 정보, 질감, 등을 이용해 물체를 구분하고 이해한다.
  • Common fate ) 물체가 가진 모양에 대한 이해로 문제를 해결한다.
반응형