인공지능/논문 리뷰

20년 동안의 객체 탐지 모델의 동향

ddingz 2023. 1. 16. 20:32

'Object Detection in 20 Years: A Survey' 논문으로 20년 동안의 객체 탐지 모델의 동향을 살펴본다.
이 논문은 20년 역사에서 객체 탐지 모델의 일부 이정표, 핵심 기술, 속도 향상 방법, 탐지 응용 프로그램, 데이터 셋, 측정 기준을 광범위하게 검토할 뿐만 아니라 커뮤니티가 현재 직면하고 있는 과제와 이러한 탐지기를 추가로 확장하고 개선할 수 있는 방법에 대해 설명한다.
컴퓨터 비전에 관심이 있는 사람은 이 논문을 직접 읽어보길 추천한다.


20년 동안의 객체 탐지

지난 20년 동안 객체 탐지의 진전은 일반적으로 두 가지 역사적 기간을 거쳤다는 것이 널리 받아들여지고 있다.
그림과 같이 2014년 이전의 전통적인 객체 감지 기간과 2014년 이후 딥러닝 기반 감지 기간의 두 가지 역사적 기간을 거쳤다.

전통적인 탐지기들

초기 객체 탐지 알고리즘의 대부분은 수작업 기능을 기반으로 구축되었다.
당시에는 효과적인 이미지 표현이 부족했기 때문에 사람들은 정교한 기능 표현과 제한된 컴퓨팅 리소스의 사용을 소진하기 위한 다양한 속도 향상 기술을 설계할 수밖에 없었다.

  • VJ detector: Viola-Jones detector
  • HOG detector
  • DPM: Deformable Part-based Model

딥러닝 기반 탐지기들

딥러닝 시대에 객체 탐지는 '2단계 탐지'와 '1단계 탐지' 두 가지 장르로 분류할 수 있다.
'2단계 탐지'는 탐지를 거친 것에서 미세한 것까지로 프레임화한다.
'1단계 탐지'는 탐지를 한 단계에서 완료로 프레임화한다.

CNN 기반 2단계 탐지기들

  • RCNN
  • SPPNet
  • Fast RCNN
  • Faster RCNN
  • FPN: Feature Pyramid Networks

CNN 기반 1단계 탐지기들

  • YOLO: You Only Look Once
  • SSD: Single Shot MultiBox Detector
  • RetinaNet