欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 人工智能 > 目标检测 >内容正文

目标检测

maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)

发布时间:2025/10/17 目标检测 24 豆豆
生活随笔 收集整理的这篇文章主要介绍了 maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

用于目标检测的池化渐进网络(Pooling Pyramid Network)

题目:

Pooling Pyramid Network for Object Detection

作者:

Pengchong Jin, Vivek Rathod, Xiangxin Zhu

来源:

Machine Learning (cs.LG)

Submitted on 9 Jul 2018

文档链接:

arXiv:1807.03284

代码链接:

https://github.com/UKPLab/elmo-bilstm-cnn-crf

摘要

我们想分享一个简单微调的单镜头多盒探测器(SSD),它能有效地减少模型尺寸,同时保持相同的性能。我们在所有的尺度上共享盒测器,并使用最大池替换尺度之间的卷积。与普通的SSD相比,它有两个优点:(1)它避免了跨尺度的分数错误校准;(2)共享预测器可以看到所有级别的训练数据。由于我们将预测器的数量减少到一个,并对它们之间的所有卷积进行了修剪,因此模型的大小要小得多。我们的经验表明,相比,普通的SSD,这些变化并没有损害模型的性能。

英文原文

We'd like to share a simple tweak of Single Shot Multibox Detector (SSD) family of detectors, which is effective in reducing model size while maintaining the same quality. We share box predictors across all scales, and replace convolution between scales with max pooling. This has two advantages over vanilla SSD: (1) it avoids score miscalibration across scales; (2) the shared predictor sees the training data over all scales. Since we reduce the number of predictors to one, and trim all convolutions between them, model size is significantly smaller. We empirically show that these changes do not hurt model quality compared to vanilla SSD.

要点

Pooling Pyramid Network (PPN)

该模型是一种单级卷积目标检测器,与传统的SSD非常相似,只是做了一些简单的改变。该预测头被设计成重量轻,运行速度快,同时保持与普通SSD相当的检测精度。网络体系结构如图1所示。

图1所示。池金字塔网络(PPN)与普通SSD的体系结构比较。左:香草SSD,右:PPN。注意,PPN中的变化是突出显示的:(1)使用max pool构建特征金字塔,(2)使用共享卷积预测器进行框分类和回归。

Shared Box Predictor

普通的SSD对不同尺度的特征图使用独立的框预测器。一个问题是对不同尺度的预测分数的错误校准。由于每个框预测器只使用分配给它的groundtruth框的一部分进行独立训练,因此不同的框预测器在训练期间可以看到非常不同数量的正例和负例。这种隐式的数据不平衡导致了来自不同预测器的分数落在非常不同的范围内的问题,这使得它们无法比拟,并且在后续基于分数的后处理步骤(如非最大抑制)中难以使用。我们设计了一个跨越不同尺度特征图的共享框预测器。因此,即使groundtruth box量表存在不平衡,box预测器也能看到所有的训练数据。这减少了错误校准和不稳定预测分数的影响。有人可能会说,为每个量表设置单独的box预测器可以增加总容量,并允许每个预测器专注于其特定的量表。然而,我们认为这可能没有必要,因为对象大多是尺度不变的。

Max Pooling Pyramid

我们的目标是建立一个多尺度的特征金字塔结构,从中我们可以使用共享框预测器进行预测。我们通过收缩基本特性通过骨干网多次使用一系列最大池操作来实现。

表1。实验对比结果:COCO检测:MobileNet SSD vs . MobileNet PPN

总结

以上是生活随笔为你收集整理的maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。