欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 人文社科 > 生活经验 >内容正文

生活经验

基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)

发布时间:2023/11/27 生活经验 52 豆豆
生活随笔 收集整理的这篇文章主要介绍了 基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1)量化:High-Bit(>2b): QAT, PTQ, QAFT; Low-Bit(≤2b)/Ternary and Binary: QAT
2)剪枝:正常、规整和分组卷积结构剪枝
3)针对特征(A)二值量化的BN融合(训练量化后,BN参数 —> conv的偏置b)
4)High-Bit量化的BN融合(训练量化中,先融合再量化,融合:BN参数 —> conv的权重w和偏置b)
对比实验如下,相关代码下载地址:下载地址

类型W(Bits)A(Bits)AccGFLOPsPara(M)Size(MB)压缩率损失
原模型(nin)FP32FP3291.01%0.150.672.68******
采用分组卷积

总结

以上是生活随笔为你收集整理的基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)(2)的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。