当前位置:
首页 >
pytorch之trainer.zero_grad()
发布时间:2023/12/10
73
豆豆
生活随笔
收集整理的这篇文章主要介绍了
pytorch之trainer.zero_grad()
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
- 在下面的代码中,在每次l.backward()前都要trainer.zero_grad(),否则梯度会累加。
- trainer.step()在参数迭代的时候是如何知道batch_size的?
因为loss = nn.MSELoss(),均方误差是对样本总量平均过得到的,所以trainer.step()使用的是平均过的grad。
参考资料:
总结
以上是生活随笔为你收集整理的pytorch之trainer.zero_grad()的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: python编程入门第一课_python
- 下一篇: 实用vba案例