[PPT] - 3D 3D Pos ose e Estimat ation on and and Mod odel el Ret PowerPoint Presentation

SLIDE 1

3D 3D Pos

se

e Estimat ation

n and

and Mod

del

el Ret Retriev eval al in n the he Wild

Vincent Lepetit

ENPC ParisTech & TU Graz

SLIDE 2

2 3D 3D pos

se,

e, 3D 3D mod

del

el re retri rieval in the wild

H-O3 O3D: Ha Hand+ d+Obj Object Da Dataset

SLIDE 3

3 3D 3D pos

se,

e, 3D 3D mod

del

el re retri rieval in the wild

H-O3 O3D: Ha Hand+ d+Obj Object Da Dataset

SLIDE 4

BB8 BB8: A A Scalable, Ac Accurate, Ro Robust to Partial Occlusion Method for Predicting the 3D Poses

f
f Chal

halleng enging ng Object ects without hout Using ng Dep

epth. Mahdi Rad and Vincent Lepetit. ICCV 2017.

3D Pose Estimation of Rigid Objects

4

SLIDE 5

Camera center

3D Pose Estimation from Correspondences

m1 m2 m3 m4

Predicting 2D locations from an image is an

easier regression task;

We do not need a representation of the 3D

rotation;

We do not need to balance the rotation and

the translation. We can compute the 3D pose from these 2D locations.

5

M

<latexit sha1_base64="pNG6kId1jlsLq98/nc1sZl0PXfc=">ALinicpdbdbts2FABgtd1PK3frzy57IywIUAxbYLUr2mI3TZa2SZt0juHUASKjoChKFiqRKkldg9wW63h9vbjLKPClvH9RZEgGK3yEPfWxaDIsVbrb/efa9Rtf3NtzdvuZ3b31/5+69+VKCVlx1RkQp6ERLEs5exYpzpjJ4VkJA8zNgw/l78IxJlQo+0NOCjXKS8DROKdG26+jw92N7lZ3dnm4UNjw4Gr9+Geq4JI0DJnXNOMKHXqdws9MkTqlGascoNSsYLQjyRhp7bJSc7UyMxWnmbtifyYiHti2tv1rs4wpBcqWke2sic6LFqW9250iJVT9jKruNnI5PyotSM03nyuMw8Lby6F6USkZ1NrUNQmVq1+/RMZGEaluw5cyU2o+rKtd1Ny9xuW7A2TkVeU54ZALJsrIygWYTbfrs4Liqlr0QImt81l7hKU8WQ+rbVpQSsc7JpIlqbqsrLZ2SbLsys3dvu53Rdu40uLMCdxvcXYEHDR6swHcNvluBgwYHK3DY4PCKn/z1oKnka5Rn324m1vD85mrJwgsmRb3yMPa69VzLSoBIeyFhCBIioSAUSQSIWEgDOeJgWJECQj6QYZjkDGSHCRH0lRBIClACiSfQD4hkSASiQJRSDSIRlKClEjOQM6QnIOcI5mATJBMQaZILkAu8G9kGwjt0nAHBG3R8BXIKyR7IHtI9kH2kbwBeYPkLchbJIcgh0h6ID0kRyBHSPogfSQDELSVwyHIEMkJyMlVN/d/7O41G3LNRlnaD2378te35ltaU7419Vsq4P8uU2vF+y/rSeqne6TMywr93/YWuIe5v8B9xMLWPkh5rKeXW+Aus+cyQ7tvH8UTBIt5E8mIDLJU17Zc08S/Fy31gXWj+N5oG19KVAl/PNDO7XtS5cxYzRYxNEYzsxS5OxblUgEqU9F1qtTv2R2XQ9ewWKaS3m4UtDTcC4KiWr62kC282fFtTGEWiSIsVCc0v3a3HT9ikiTtPozqhCc6KMeFa5PYVGbM+EWdYWFgM8Ae8ZSdshk3y1m59pjqtw+luPH+0Zb/eMs/+nXjxQ4cWG86D5wfnYeO7zx1Xjh7Ts85dqjDnD+dv5y/O7c7jzrPO7/NQ69fgzE/OEtXZ/df5Xz1Rw=</latexit>

m

<latexit sha1_base64="ihyU/UrEqlV9uKtS1GtUl3ZCPFk=">ALinicpdbdbts2FABgtd1PK3frzy57IywIUAxbYLUr2mI3TZa2SZt0juHUASKjoChKFiqRKkldg9wW63h9vbjLKPClvH9RZEgGK3yEPfWxaDIsVbrb/efa9Rtf3NtzdvuZ3b31/5+69+VKCVlx1RkQp6ERLEs5exYpzpjJ4VkJA8zNgw/l78IxJlQo+0NOCjXKS8DROKdG26yj/cHeju9WdXR5u+NDYcODqfbjnqiAStMwZ1zQjSp363UKPDJE6pRmr3KBUrCD0I0nYqW1ykjM1MrOVt6m7Ym8WEj74tqb9S6OMCRXapqHNjIneqzaVneutEjVE7ay6/jZyKS8KDXjdJ48LjNPC68uhRelklGdTW2DUJna9Xt0TCSh2hZsOTOl9uOqynXdzUtcrhtwdk5FnhMemUCyrKxMoNlEmz47OK6qZS+EyBqftVd4ypPFkPq2FaVErHMyaKa2+pKS6ck267M7N3bme0nTsN7qzA3QZ3V+Bgwcr8F2D71bgoMHBChw2OLziJ389aCr5GuXZt5uJNTy/uVqy8IJUa8jL1uPdeyEiDSXkgYgoRIKAhFEoFESBgIw3lioBhRAoJ+kOEYZIwkB8mRNFUQSAqQAsknkE9IJIhEokAUEg2ikZQgJZIzkDMk5yDnSCYgEyRTkCmSC5AL/BvZBkK7NwBQVs0fAXyCskeyB6SfZB9JG9A3iB5C/IWySHIZIeSA/JEcgRkj5IH8kABG3lcAgyRHICcnLVzf0fu3vNhlyzUZb2Q9u+/PWt+ZbWlG9N/ZYK+L/L1Frx/st6kvrpHinzskL/t70F7mHuL3AfsbC1D1Ie6+nlFrjL7DlHskM7x8Fk0QL+ZMJiEzylFf23JMEP9etdYH143geaFtfClQJ/zQTm370mXMGE/02ATR2E7M0mSsWxWIRGnPhVarU39kNl3PXoFiWot5+NJQEzCuSsnqeprA9psN39YURpEo0mJFQvNLd+vxEzZp4s7TqE5ogrNiTLgWuT0GlRkzflFnWBjYDLBHPGWnbMbNclauPab67UMpbrx/tOU/3vKPft14sQMH1pvOA+dH56HjO0+dF86e03OHeow50/nL+fvzu3Oo87zm/z0OvXYMwPztLV2f0XSlr1Zw=</latexit>

SLIDE 6

6

3D Pose Retrieval for Object Categories

3D 3D Pose

se Est

stim imat ation ion and and 3D 3D Mod

del

el Ret Retrieval rieval for

r Object

jects s in in the he Wild

ild. Alexander

Grabner, Peter M. Roth, and Vincent Lepetit. CVPR 2018.

SLIDE 7

7

3D Pose Retrieval for Object Categories

2d bounding boxes

SLIDE 8

3D Pose Retrieval for Object Categories

pose predictor 3D pose ?

8

SLIDE 9

3D Pose Retrieval for Object Categories

network (length, width, height) of

bject’s

bounding box PnP 3D pose of the

bject’s

bounding box

height width length

9

2D reprojections

SLIDE 10

3D Model Retrieval for Object Categories

10

Locat Location ion Field Field Descrip escriptors:

rs: Sing

ingle le Imag age e 3D 3D Mod

del

el Ret Retrieval rieval in in the he Wild ild. Alexander Grabner, Peter M. Roth, and Vincent Lepetit. 3DV 2019.

SLIDE 11

3D Model Retrieval for Object Categories

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

ShapeNet [Chang et al, 2015]

11 pose invariant descriptors

SLIDE 12

Location Fields

12

SLIDE 13

Learning the Descriptors

Descriptor CNN Descriptor CNN Descriptor CNN Descriptor CNN

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

⇣ . . . ⌘

<latexit sha1_base64="0GjcsQugI5c5fp4RGqChCknagkE=">ALFHicpdbRb9NGABwxgDb4PCHnkxqyqxauSAWLaUykFWmhZGqW0Ui+qzuezY2H73LtzmvTkf4Nn/hCeNm2PwCv/zc7J56nx12arainK5X53950/6+LPz5NY6Vbr86XLX1z58upX167X3/z7Y2bC7duv1aikIzvMJEIuedTxZM4zs61gnfyWnqZ/wXf/Nk8p3h1yqWGQ9Pc5P6VRFocxo9p2HSz8RhIe6nvkLrnrEp9HcWaolHRcGla6ZBgIrVzCswB6p+NkHA30DwcLi63l1uTycKMNjUHrs7Bret/kECwIuWZglVar/dynXfLq1jlnAbr1A8p+wNjfi+bWY05apvJjdZeku2J/BCIe0n096k9+QMQ1OlxqlvR6ZUD1Tqs5TLVDVgo3oOvy1b+IsLzTP2DR4WCSeFl6VRS+IJWc6GdsGZTK2+/fYgErKtM31bGTG7O2q0nXdpXNcrksyfsREmlKbfCJ5UpSGaD7Sps3d8py1nMhkton7YrEeqUjuoh9c/yQptiNFkrzeTbW2tGtJ2bNW6egq9qfHUK9mrsXCLz3v1LT/vNeNs2KPAa57+uFgw/5hLUe3cD71WtdasUiDa3Ijvg/hIApAzwmBQkQRSIRkADJAkoKkSOo7EkhykBzJIcghEgkikSgQhUSDaCQFSIFkCDJEcgRyhGQEMkIyBhkjOQY5xs/7MdBjNGkVZBXJM5BnSNZB1pFsgGwgeQHyAslLkJdItkC2kHRAOki2QbaRdEG6SHog6Fj6uyC7SPZA9i56UP/jpM47dmcflJnz0LSzH9+cpzQnfXPyN5PA/52mxo43nlaLVC/LQJmnJfrv7JzgDubuCe4iFjb3JM5CPT7fBte4LRsk37Lr/p5zSbWQPxpCZTGWnLiIj8VLXmDazegdOBtnXWQBVl/74pY9s+dxoTnkV6YEgwsAvzqlpqZCAQha3QrJb7b5Zcj17EcW1FtPhM1ONLcBUIXmVT0Nsv1ls25zCLBoEWpwS0PzcWr7/kI/qcUdxUAU0ZJgPaKZFaquKIuGmnVcRTkysJ9iKSdkl63mTmKVrq752s8bDjde/LfvL7e2HyurEL9d82543zv3HPaziNnxVl3Os6Ow5x3zt/OR+eT+9Z97/7p/jUdevkSzPnOmbncD/8AX6zICA=</latexit>

13

SLIDE 14

3D Model Retrieval

14

SLIDE 15

15

Retrieved 3d poses and models

SLIDE 16

More Results on Pix3D [Sun et al, 2018]

16 16

SLIDE 17

3D Pose Refinement for Object Categories [soon]

SLIDE 18

18 3D 3D pos

se,

e, 3D 3D mod

del

el re retri rieval in the wild

H-O3 O3D: Ha Hand+ d+Obj Object Da Dataset

SLIDE 19

Annotations in 3D are Hard

It is possible to use only synthetic images for training, but we should still evaluate on real images.

SLIDE 20

HO-3D[++]: Hand+Object Dataset

20

SLIDE 21

HO-3D[++]: Hand+Object Dataset

21

SLIDE 22

HO-3D[++]: Hand+Object Dataset

22

65 sequences, 10 persons, 10 objects, about 85’000 frames in total

SLIDE 23

Automated Annotations

24

MANO model [Romero et al, 2017]

bject 3D model from YCB

[Cali et al, 2015]

ptimization
ver the

sequence

SLIDE 24

Constraints

+ RGBD likelihood: Joint segmentation and depth constraints, enforced using differential rendering; + Physical constraints (avoids non-possible hand poses, avoids interpenetration between hand and object); + Temporal constraints: smooth motions over the sequence. joint segmentation prediction joint depth prediction

SLIDE 25

28

min

{(pH

t ,pO t )}t

P

t

kIt I(pH

t , pO t )k2 + kDt D(pH t , pO t )k2 +

Ω(pH

t ) + kpH t+1 pH t k2 + kpO t+1 pO t k2

<latexit sha1_base64="8//n65i/ad2Q62cw3seGE4y6j6M=">AAAMq3icpdZbb9s2FABgubt1mrel3eNehAUp2rUJrHbFBuylydzWbpPa8Zw6WOgYlETJQnWrSCV2WL3sdfsL+2H7I3seJR8Fto/jLYgAwxS/w4uORIlWEvhcNBp/12599PEnn352+3P9i/qXX329 cefuWx5nqc2O7DiI02OLchb4ETsSvgjYcZIyGloBG1jvfil8cMZS7sdRX0wTNgypF/mub1OhqkYb/xCLeX4kaZrSaS6DINdJ6Eck8ENf8JEk8j6xkpE4bT0yZoXOA5KPRG4QnoVVmDDuGeRDW/1vG+0VDT6cPjYeqohmGdG8IoL8rGLIicnCoX6PdELm0SryQdm8DJfi

ZmftlQ/YMZl93PeufRO6YTohEUOXKc+2ths7DTKw8AFEwqbGhzd0R39L+LEdhaySNgB5fzEbCRiqPoTvh0wlbWMs4Ta76jHTlQxoiHjQ1neoNzYUjWO4cap+kXCKGvnW0gacj4NLRUZUjHmy1ZUrjSHFx0ujS7cn4bSj5JMsMieDe5mgSFio3gCDMdPmS2CqSpQO/XV

/A17TFNqC/WcLI5s2+pyea7r+tY1Dl0nETu34zCkKuMkZUGWSyLYRMge2z/K80VP4jiovCyvcD/y5kOK06UoHrsipJMqqjrNbzR1mwa7uSz/jd3lEVXlXoV7K7BZYXMF7le4vwLfVPhmBfYr7K/AQYWDG175y36VyZdonLZ6h7CKZyc3G8y6YGlczNxyjUbR16JSILo8 EcsCsZDYIDYSB8RBwkAYHscFchF5IOiBtMYgYyQhSIikykKMJAFJkLwHeY8kBUmRcBCORIAIJBlIhuQM5AzJOcg5kgnIBMkUZIrkAuQCPyO7QGiVWnsgaIlaL0BeIGmBtJC0QdpIXoG8QvIa5DWSA5ADJF2QLpJDkEMkPZAekj4IWsrWAGSA5Bjk+KaL+z9W95oFuWah LKyHZbv69q25S2vStyZ/Cwn832lamnH7edFJ8XV3uHyeo/dtd467mHtz3EMcq9wTP3LF9HoTbDK1z0nZgeq3k7CUijj9XhKaemp7mKt9j0ceFaV1gcXneBaoSlcFci+6/Gj7qnxl4AGjl5Fl+doJD1jkibEkzlj1zHxvLJZy5cSZ2jgrzU/ModzSDXUQzoSIZ+ELTaXa UPIsZUXmJVH1ctNU2YdW1HFEvGJAud3YefKUTaq4c98pBpTkLBnTSMSh2jBlAZNmUoww17BqoDaDXHVZtSvHLDe05vL2FRfePt4xn+yYhz9sPtuDre1t7VvtO+2+Zmo/as+0ltbVjjS7Rmq/1/6o/Vnfrv9a/61OZqG3atDmG23hqLN/AW3rWbU=</latexit>

SLIDE 26

29

Primary RGB-D cam, used for annotation

Secondary (sideview) RGB-D camera, used for validation only

SLIDE 27

Alexander Grabner Peter Roth Madhi Rad Shreyas Hampali

SLIDE 28

Thanks for listening! Questions?

Alexander Grabner Peter Roth Madhi Rad Shreyas Hampali