Mask R-CNN

Overview

이미지 내에서 각 instance(object)에 대한 segmentation mask 생성 (classification + localization)
Mask R-CNN은 Faster R-CNN에 mask branch를 추가한 구조
연구 목표는 instance segmentation task에서 사용 가능한 딥러닝 프레임워크를 개발하는 것

Faster R-CNN의 RPN에서 얻은 ROI(Region of Interest)에 대해 pixel 단위의 segmentation mask를 예측하는 branch를 추가한 구조
객체의 class를 예측하는 classification branch, bbox regression을 수행하는 bbox regression branch와 독립적으로 segmentation mask를 예측하는 mask branch를 추가
Mask R-CNN과 Faster R-CNN과 차이는 RoIAlign
- Faster R-CNN은 pixel 단위의 segmentation을 위해 설계되지 않음
- 이를 위해 RoIAlign이라는 간단하면서 정확한 공간 정보를 보존하는 레이어 제안
- 이는 Faster R-CNN보다 mask의 정확도를 10~50% 높임

Mask representation