编码调试:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 12: illegal multibyte sequen
生活随笔
收集整理的这篇文章主要介绍了
编码调试:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 12: illegal multibyte sequen
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
在程序段:
stopkey = [w.strip() for w in codecs.open('data/stopWord.txt', 'r').readlines()]出现错误:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 12: illegal multibyte sequen
这是因为stopWord.txt内存在汉字与字母混合的结果。改正如下:
stopkey = [w.strip() for w in codecs.open('data/stopWord.txt', 'rb').readlines()]
或者:
stopkey = [w.strip() for w in codecs.open('data/stopWord.txt', 'r',,encoding='utf-8').readlines()]
总结
以上是生活随笔为你收集整理的编码调试:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 12: illegal multibyte sequen的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 改正错误:tensorflow.pyth
- 下一篇: Docker知识1:Docker-hub