欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

Learning Less is More – 6D Camera Localization via 3D Surface Regression

发布时间:2023/12/31 编程问答 63 豆豆
生活随笔 收集整理的这篇文章主要介绍了 Learning Less is More – 6D Camera Localization via 3D Surface Regression 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

在Python满天飞, tensorflow横行的DL界, 遇到好久不见的开源C++ Project简直是一股清流...................

Proj:https://hci.iwr.uni-heidelberg.de/vislearn/research/scene-understanding/pose-estimation/

Git:https://github.com/vislearn/LessMore

 

Key Point:  differentable  RANSAC

 

Learning Less Is More - 6D Camera Localization via 3D Surface Regression

本文由德国海德堡大学完成,跟上面介绍的 MapNet 一样,也是研究从单张图像恢复相机 6DOF 位姿的问题。在目前主流的基于深度学习进行相机 6DOF 定位的方法中,一般都采用端到端地学习整个相机定位的过程或者用学习相机定位的大部分流程。这篇文章与其它方法不太一样,作者认为,其实只需要学习相机定位中的一个模块便足够做到精准的定位。基于作者之前的 CVPR 2017 的可导 RANSAC 方法,作者提出了一种用全连接神经网络来稠密拟合“场景坐标”的方法,建立输入彩色图像和三维场景空间的联系。“场景坐标”是指将图像中的局部块映射到三维空间中三维点,从而得到局部块的坐标。由于局部块具有相对比较稳定的外观,即对视角变化不太敏感,使得对齐图像和三维模型比较容易。作者提出的这种方法具有高效、精确、训练鲁棒、泛化能力强等优点,其在室内和室外的数据集上都一致地比当前领先的技术要好。最后值得一提的是,这种方法在训练的时候不需要利用一个已知的三维场景模型,因为训练的时候可以自动地从单目视觉约束中学习到这个三维场景的几何信息。从论文中描述的在 7Scenes 数据集上的性能来看,本篇论文的方法的精度比MapNet 方法的精度要高出不少。

Our method scales to large outdoor scenes but fails on city-scale scenes like the challenging Cambridge Street scene [11]. In the future, we could pair our system with an image retrieval approach as proposed in [21].

文章阐述,在应用大场景中,此种方法是失败的.预期在后期引入图像检索的方法;

 

总结

以上是生活随笔为你收集整理的Learning Less is More – 6D Camera Localization via 3D Surface Regression的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。