1. Introduction
- network for 6D object pose estimation
- 큰 scale의 RGB_D video dataset을 6D objet pose estimation에 사용했다.
- SahpeMatch-Loss, 새로운 loss function을 object estimation에 도입했다.
2. Key techincal Concept
Semantic labeling
- 512 dimension feature maps
- original image의 1/8이나 1/16을 사용하니, 64dim convolution layer가 사용됨
- DeConv layer 사용으로 n이 semantic class의 개수가 된다.
나중에는 softmax cross entropy loss를 사용해서 convolution 계산
3D translation Estimation
- Camera coordinate와 object coordinate 각각 X', Y', Z'와 X, Y, Z 총 6개의 orientation이 사용되게 된다.
- T set이 사용되게 되면서 하나의 object에 대한 여러 카메라의 orientation을 취합할 수 있게 된다.
3D rotation Regression
- PoseLoss
- ShapeMatch-loss
Experiment
- Dataset : YCB-video, occludedLINEMOD
- Baseline : SOTA 3D coordinate, Iterative Closet Point
그냥 POSECNN이 성능이 좋고, 다른 그래프에서도 count와 accuracy를 봤을 때 당연히 성능이 좋다. 그래야 논문이지
Conclusion
- 6D object pose estimation을 제안
-Semantic labeling + 3D translation estimation + 3D rotation regression을 한다
- ShapeMatch-loss를 제안
: 그래서 PoseCNN이 최신의(state-of-the-art 6D object pose estimation이다)
https://github.com/yuxng/PoseCNN
'AI Engineering Topic > 논문 리뷰' 카테고리의 다른 글
RAG 논문 리뷰 (0) | 2023.11.07 |
---|---|
Deep convolutional Neural network based autonomous dron navigation (0) | 2022.04.29 |
Learning Synergies between pushing and with Self-supervised Deep Reinforcement learning (0) | 2022.04.22 |
DOVE : Data offloading through Spatio-temporal Rendezvous in Vehicular Network (0) | 2022.04.20 |
SAINT : Selp adaptive Interactive Navigation 논문리뷰 (0) | 2022.04.20 |