当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

【知识星球】3D网络结构解读系列上新

发布时间：2025/3/20 编程问答 44 豆豆

生活随笔收集整理的这篇文章主要介绍了【知识星球】3D网络结构解读系列上新小编觉得挺不错的,现在分享给大家,帮大家做个参考.

欢迎大家来到《知识星球》专栏，这两天有三AI知识星球专注更新3D相关的网络模型解读，共10期左右。3D网络在视频数据，点云图像，3D医学图像，光流估计等领域有重要的作用，是当前的一类主流模型。

作者&编辑 | 言有三

有三AI知识星球-网络结构1000变

PointNet

点云就是一些三维点的集合，处理点云技术需要三维的卷积架构，早期处理点云首先将其转换为有固定顺序的三维晶格，然后用普通的三维卷积网络处理，但是这种转换往往带来副作用。PointNet是首个直接处理无序点云数据的网络，可以用于点云分类和分割任务，取得了很好的效果。

作者/编辑言有三

点云数据是一组无序的向量集合，若不考虑其他诸如颜色等因素，只考虑点的坐标，相同的点云可以由两个完全不同的矩阵表示。有N个点的点云，实际上有N！种排序，对于没有固定规则的排序，卷积神经网络CNN中的权重共享等策略就无法应用，因此CNN无法直接应用于点云数据。

要使得网络对点云的这些输入组合输出相同的结果，有三种常见思路。其一是按照坐标进行排序，但是排序方法也不是唯一和稳定的。其二就是将所有的排序组合作为一个序列输入RNN等网络，但这样显然计算效率极低。其三就是设计一些函数，使其输出对输入的顺序不敏感，这就是PointNet的处理思路。

网络结构如下：

以上网络包含了两个重要的技术：

(1) 使用maxpooling解决无序性问题。特征提取网络得到的特征为n×1024，使用maxpooling将其变成1x1024的全局特征，然后送入分类网络。

(1) 使用空间变换网络获取空间转换不变性。利用网络学习点云本身的位姿信息，得到旋转矩阵，图中包括两次。第一次是input transform，它对空间中的点云进行旋转调整后得到更有利于任务的角度，变换矩阵为3×3，这属于数据预处理。第二次是feature transform，它将提取出的64维特征进行对齐，变换矩阵为64×64。由于变换矩阵过大，通过添加正则项，使变换矩阵近似于正交矩阵，从而大大降低参数量。

如果是分割问题，则将feature transform后的特征和全局特征进行concat得到特征，然后输入分割模块。

以上是该方法和其他主流模型在3D形状数据集Model40上的分类结果，除了多视角模型之外，有较大的性能优势。

上图展示的是Kinect数据集和Model40的分割结果。

更多相关的模型解读

加入有三AI知识星球即可获取

每日更新

已经超过3万字的内容

覆盖各类主流网络架构

转载文章请后台联系

侵权必究

往期精选

【知识星球】千奇百怪的网络结构板块更新到哪里了？
【知识星球】动态推理网络结构上新，不是所有的网络都是不变的
【知识星球】做作业还能赢奖金，传统图像/机器学习/深度学习尽在不言中
【知识星球】数据集板块重磅发布，海量数据集介绍与下载
有三AI知识星球官宣，BAT等大咖等你来撩
揭秘7大AI学习板块，这个星球推荐你拥有
有三AI“夏季划”出炉，今夏进阶中级CV算法工程师

总结

以上是生活随笔为你收集整理的【知识星球】3D网络结构解读系列上新的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：【GAN优化】一览IPM框架下的各种GA
下一篇：【图像分割应用】医学图像分割小总结