AI Engineering Topic/논문 리뷰

PoseCNN : A convolutional nerual network for 6D object pose estimation in cluttered scenes

Young_Metal 2022. 4. 22. 16:31

1. Introduction

 - network for 6D object pose estimation 

- 큰 scale의 RGB_D video dataset을 6D objet pose estimation에 사용했다. 

- SahpeMatch-Loss, 새로운 loss function을 object estimation에 도입했다. 

 

 

2. Key techincal Concept

Semantic labeling

- 512 dimension feature maps

- original image의 1/8이나 1/16을 사용하니, 64dim convolution layer가 사용됨

 - DeConv layer 사용으로 n이 semantic class의 개수가 된다. 

나중에는 softmax cross entropy loss를 사용해서 convolution  계산

 

3D translation Estimation

 - Camera coordinate와 object coordinate 각각 X', Y', Z'와 X, Y, Z 총 6개의 orientation이 사용되게 된다. 

- T set이 사용되게 되면서 하나의 object에 대한 여러 카메라의 orientation을 취합할 수 있게 된다. 

 

3D rotation Regression

 - PoseLoss

 - ShapeMatch-loss

 

Experiment

 - Dataset : YCB-video, occludedLINEMOD

 - Baseline : SOTA 3D coordinate, Iterative Closet Point

그냥 POSECNN이 성능이 좋고, 다른 그래프에서도 count와 accuracy를 봤을 때 당연히 성능이 좋다. 그래야 논문이지

 

Conclusion

 - 6D object pose estimation을 제안

 -Semantic labeling + 3D translation estimation + 3D rotation regression을 한다

 - ShapeMatch-loss를 제안

: 그래서 PoseCNN이 최신의(state-of-the-art 6D object pose estimation이다)

https://github.com/yuxng/PoseCNN

 

GitHub - yuxng/PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes - GitHub - yuxng/PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

github.com