본문 바로가기

논문리뷰3

[논문 리뷰] Mask R-CNN https://arxiv.org/pdf/1703.06870.pdf : Mask R-CNN 논문을 바탕으로 작성하였다. Mask R-CNN Instanace Segmentation은 이미지 내에 존재하나는 모든 객체를 탐지하는 동시에 각각의 경우를 정확하게 픽셀 단위로 분류하는 task이다. Preview Faster R-CNN의 RPN에서 얻은 RoI에 대하여 객체의 class를 예측하는 classification branch, bbox regression을 수행하는 box regression branch와 평행으로 segmentation mask를 예측하는 mask branch를 추가한 구조를 가진다. → Mask branch는 각각 RoI에 작은 크기의 FCN이 추가된 형태이다. Segmentatio.. 2022. 4. 4.
[논문 리뷰] Stacked Hourglass https://arxiv.org/pdf/1603.06937.pdf Stacked Hourglass Networks for Human Pose Estimation 논문을 참고하여 작성하였다. 시작에 앞서 Human pose estimation의 2가지 방식인 top-down 방식과 bottom up 방식에 대해 정리해보자. 1. Top-down 방식 : 사람을 먼저 감지한 후 다음 각 사람의 자세를 추정한다. 2. Bottom-up 방식 : 관절 부위(key point)를 먼저 감지하여 서로 연결해 모든 사람의 자세를 추정한다. Stacked Hourglass Stacked Hourglass는 single person의 pose를 예측하는 모델이고, 모래시계를 쌓아둔 모양을 가진 네트워크이다. 이미지의 모.. 2022. 4. 2.
[논문 리뷰] MobileNetV1 & MobileNetV2 https://arxiv.org/pdf/1801.04381.pdf MobileNetV2: Inverted Residuals and Linear Bottlenecks https://arxiv.org/pdf/1704.04861.pdf MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 위 논문을 참고하여 작성하였다. MobileNetV1 MobileNetV1은 light weight deep neural network, depthwise separable convolution을 통해 모델 경량화에 집중하였다. 모델 경량화에 집중한 이유로는 저용량 메모리 환경인 핸드폰과 같은 곳에 딥러닝을 적용하기 위해서이다. 메.. 2022. 4. 2.