基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
生活随笔
收集整理的这篇文章主要介绍了
基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
1)量化:High-Bit(>2b): QAT, PTQ, QAFT; Low-Bit(≤2b)/Ternary and Binary: QAT
2)剪枝:正常、规整和分组卷积结构剪枝
3)针对特征(A)二值量化的BN融合(训练量化后,BN参数 —> conv的偏置b)
4)High-Bit量化的BN融合(训练量化中,先融合再量化,融合:BN参数 —> conv的权重w和偏置b)
对比实验如下,相关代码下载地址:下载地址
| 类型 | W(Bits) | A(Bits) | Acc | GFLOPs | Para(M) | Size(MB) | 压缩率 | 损失 |
|---|---|---|---|---|---|---|---|---|
| 原模型(nin) | FP32 | FP32 | 91.01% | 0.15 | 0.67 | 2.68 | *** | *** |
| 采用分组卷积 |
总结
以上是生活随笔为你收集整理的基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 基于pytorch量化感知训练(mnis
- 下一篇: 【camera-radar】基于ROS的