欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

GPU下train 模型出现nan

发布时间:2023/12/2 36 豆豆
生活随笔 收集整理的这篇文章主要介绍了 GPU下train 模型出现nan 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

When training on GPU, the error "Model diverged with loss = NaN" is often caused by a sotmax that's getting a symbol larger than vocab_size

   

转载于:https://www.cnblogs.com/wuxiangli/p/10344259.html

总结

以上是生活随笔为你收集整理的GPU下train 模型出现nan的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。