欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

【知识星球】3D网络结构解读系列上新

发布时间:2025/3/20 编程问答 44 豆豆
生活随笔 收集整理的这篇文章主要介绍了 【知识星球】3D网络结构解读系列上新 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

欢迎大家来到《知识星球》专栏,这两天有三AI知识星球专注更新3D相关的网络模型解读,共10期左右。3D网络在视频数据,点云图像,3D医学图像,光流估计等领域有重要的作用,是当前的一类主流模型。

作者&编辑 | 言有三

有三AI知识星球-网络结构1000变

PointNet

点云就是一些三维点的集合,处理点云技术需要三维的卷积架构,早期处理点云首先将其转换为有固定顺序的三维晶格,然后用普通的三维卷积网络处理,但是这种转换往往带来副作用。PointNet是首个直接处理无序点云数据的网络,可以用于点云分类和分割任务,取得了很好的效果。

作者/编辑 言有三

点云数据是一组无序的向量集合,若不考虑其他诸如颜色等因素,只考虑点的坐标,相同的点云可以由两个完全不同的矩阵表示。有N个点的点云,实际上有N!种排序,对于没有固定规则的排序,卷积神经网络CNN中的权重共享等策略就无法应用,因此CNN无法直接应用于点云数据。

要使得网络对点云的这些输入组合输出相同的结果,有三种常见思路。其一是按照坐标进行排序,但是排序方法也不是唯一和稳定的。其二就是将所有的排序组合作为一个序列输入RNN等网络,但这样显然计算效率极低。其三就是设计一些函数,使其输出对输入的顺序不敏感,这就是PointNet的处理思路。

网络结构如下:

以上网络包含了两个重要的技术:

(1) 使用maxpooling解决无序性问题。特征提取网络得到的特征为n×1024,使用maxpooling将其变成1x1024的全局特征,然后送入分类网络。

(1) 使用空间变换网络获取空间转换不变性。利用网络学习点云本身的位姿信息,得到旋转矩阵,图中包括两次。第一次是input transform,它对空间中的点云进行旋转调整后得到更有利于任务的角度,变换矩阵为3×3,这属于数据预处理。第二次是feature transform,它将提取出的64维特征进行对齐,变换矩阵为64×64。由于变换矩阵过大,通过添加正则项,使变换矩阵近似于正交矩阵,从而大大降低参数量。

如果是分割问题,则将feature transform后的特征和全局特征进行concat得到特征,然后输入分割模块。

以上是该方法和其他主流模型在3D形状数据集Model40上的分类结果,除了多视角模型之外,有较大的性能优势。

上图展示的是Kinect数据集和Model40的分割结果。


更多相关的模型解读

加入有三AI知识星球即可获取

每日更新

已经超过3万字的内容

覆盖各类主流网络架构


转载文章请后台联系

侵权必究

往期精选

  • 【知识星球】千奇百怪的网络结构板块更新到哪里了?

  • 【知识星球】动态推理网络结构上新,不是所有的网络都是不变的

  • 【知识星球】做作业还能赢奖金,传统图像/机器学习/深度学习尽在不言中

  • 【知识星球】数据集板块重磅发布,海量数据集介绍与下载

  • 有三AI知识星球官宣,BAT等大咖等你来撩

  • 揭秘7大AI学习板块,这个星球推荐你拥有

  • 有三AI“夏季划”出炉,今夏进阶中级CV算法工程师

总结

以上是生活随笔为你收集整理的【知识星球】3D网络结构解读系列上新的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。