본문 바로가기

논문 리뷰11

[논문 리뷰] HRNet https://arxiv.org/pdf/1902.09212.pdf Deep High-Resolution Representation Learning for Human Pose Estimation 논문을 참고하여 작성하였다. Abstract HRNet은 single person의 pose를 예측하는 모델이고, 본 논문에서 제공하는 network는 높은 해상도를 전체 프로세스 동안 유지하는 특징을 가지고 있다. : maintains high reoslution representations through whole process High resolution subnetwork를 시작으로 점점 stage 추가를 위해 high-to-low resolution subnetwork를 추가하며, multi resolut.. 2022. 4. 2.
[논문 리뷰] Stacked Hourglass https://arxiv.org/pdf/1603.06937.pdf Stacked Hourglass Networks for Human Pose Estimation 논문을 참고하여 작성하였다. 시작에 앞서 Human pose estimation의 2가지 방식인 top-down 방식과 bottom up 방식에 대해 정리해보자. 1. Top-down 방식 : 사람을 먼저 감지한 후 다음 각 사람의 자세를 추정한다. 2. Bottom-up 방식 : 관절 부위(key point)를 먼저 감지하여 서로 연결해 모든 사람의 자세를 추정한다. Stacked Hourglass Stacked Hourglass는 single person의 pose를 예측하는 모델이고, 모래시계를 쌓아둔 모양을 가진 네트워크이다. 이미지의 모.. 2022. 4. 2.
[논문 리뷰] Convolutional Pose Machine https://arxiv.org/pdf/1602.00134.pdf Convolutional Pose Machines 논문을 참고하여 작성하였다. 이번 논문은 Human pose estimation에 관련된 Convolutional Pose Machine이다. CNN이 Human pose estimation에 적합한 이유로는 관절 위치 예측시 이미지 맥락을 파악하여 예측하는 것이 가능하기 때문이다. 따라서 관절 간의 상관관계를 학습하여 더 좋은 예측 값을 추출 할 수 있다. CPM 모델은 Pose machine + CNN 으로, receptive fied(지역적 정보) 를 global한 영역을 확대하여 다른 부위와의 관계를 고려한 모델이다. CPM Model 먼저 CPM은 각 stage에서 multi-cl.. 2022. 4. 2.
[논문 리뷰] MobileNetV1 & MobileNetV2 https://arxiv.org/pdf/1801.04381.pdf MobileNetV2: Inverted Residuals and Linear Bottlenecks https://arxiv.org/pdf/1704.04861.pdf MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 위 논문을 참고하여 작성하였다. MobileNetV1 MobileNetV1은 light weight deep neural network, depthwise separable convolution을 통해 모델 경량화에 집중하였다. 모델 경량화에 집중한 이유로는 저용량 메모리 환경인 핸드폰과 같은 곳에 딥러닝을 적용하기 위해서이다. 메.. 2022. 4. 2.
[논문 리뷰] ResNet Deep Residual Learning for Image Recognition https://arxiv.org/pdf/1512.03385.pdf 논문을 참고하여 작성하였다. Introduction 저번 VGGNet에서 CNN의 layer가 깊어질수록 성능이 좋아지는 것을 확인할 수 있었지만, VGGNet-19에서 오차율이 떨어지지 않는 것을 확인할 수 있었다. Layer가 더 깊어지면 Vanishing/Exploding gradient 현상이 발생하는데, 정확도가 어느 순간 정체되고 layer가 깊어질수록 성능이 더 나빠지는 현상인 Degradation problem이라는 문제점이 발생하게 된다. Vanishing/Exploding gradient의 경우 layer 중간에 BatchNorm 을 적용해주.. 2022. 3. 31.