【论文阅读】【3d目标检测】Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
论文标题:Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
AAAI2022 南加大
这篇文章的主题思想是认为现在的基于点云的目标检测方法实际上都是2.5D的方法而非3d的方法:原因是3d点云虽然具有3d的信息,但是点云检测到的物体往往是存在遮挡问题的。
作者将物体上的点云遮挡情况划分为三个部分:
外部遮挡:即目标前有遮挡物,如下图©所示。激光打到遮挡物后返回,导致目标形状缺失,©中红色区域即缺失区域。
信号缺失:由于某些材料或者反射角度等问题,激光打到目标时,不会返回,造成信号缺失,如下图©中蓝色区域。
自我遮挡:即目标前面遮挡后面。由于激光不能穿透,激光打到目标前面区域后就会返回,导致目标后面区域信息缺失,如下图(d)中绿色区域所示。
作者将它们依次补全,发现得到了ap上的提升!
于是作者决定提出一个网络,来探究那些被遮挡住的点!
对于基准框中目标形状的近似
遮挡和信号缺失的问题使得我们不能获得关于基准框中目标的完整的形状信息。因此作者利用如下两个假设来近似目标的完整形状信息,两个假设分别是:
大多数前景对象类似于数量有限的形状原型,例如行人有几种固定的体型。
前景对象,特别是车辆和骑自行车者,大致对称。
基于这两个假设,作者先补全目标的点云。
具体做法是利用目标框,找到属于目标的点云,利用标注框镜像所有的点云。
作者在原文中讲利用source point来补全target的,具体做法是:
有点奇怪,作者实际上是做了n个source 来进行补全?
这样的话是不是好麻烦。而且从后面的操作来看的话也不是很有必要:
随后作者用均匀球面进行点云的体素化。由球面编码作者得出被遮挡的区域:
随后作者把补充后的点云投影到体素中,非空体素则进行label为occupancy 的区域,其他的为0.
由此我们便一次为监督作为训练。
有个问题是,既然我们前面已经用了gt来进行点云的补充,那为什么不省略这一步点云补充,直接用bbox粗略地来进行occupancy区域的label呢?这样的效果不是更好吗。
随后作者便用一个网络来检测占据率,
将占据率投影到rpn的各层feature中,进行feature拼接,随后进行roi pooling,得到优化的bbox。
关注这篇文章主要是该文章对于单车行人有很好的检测效果,但是感觉创新点还是一般。
总结
以上是生活随笔为你收集整理的【论文阅读】【3d目标检测】Behind the Curtain: Learning Occluded Shapes for 3D Object Detection的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 王者荣耀服务器什么时候增加人数,王者荣耀
- 下一篇: 【深度学习实战04】——SSD tens