欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

统计哈姆雷特文本中高频词的个数

发布时间:2023/11/30 编程问答 47 豆豆
生活随笔 收集整理的这篇文章主要介绍了 统计哈姆雷特文本中高频词的个数 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

统计哈姆雷特文本中高频词的个数

三国演义人物出场统计

开源代码
讲解视频

kou@ubuntu:~/python$ cat ClaHamlet.py #!/usr/bin/env python # coding=utf-8#e10.1CalHamlet.py def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ") #将文本中特殊字符替换为空格return txt hamletTxt = getText() words = hamletTxt.split() counts = {} for word in words: counts[word] = counts.get(word,0) + 1 items = list(counts.items()) items.sort(key=lambda x:x[1], reverse=True) for i in range(10):word, count = items[i]print ("{0:<10}{1:>5}".format(word, count))

总结

以上是生活随笔为你收集整理的统计哈姆雷特文本中高频词的个数的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。