使用jieba 提取 关键词
生活随笔
收集整理的这篇文章主要介绍了
使用jieba 提取 关键词
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
如何提取句子的关键词?
以前用textrank4zh
https://blog.csdn.net/weixin_44510615/article/details/89548486
竟然不知道 jieba.analyse 也可以提取关键词,还封装了tfidf 的接口
from jieba import analyse tfidf = analyse.extract_tagsif __name__ == '__main__':text="""据半岛电视台援引叙利亚国家电视台称,叙利亚已经对美国、英国、法国的空袭进行了反击。据介绍,在叙军武器库中,对西方最具威慑力的当属各型战术地对地弹道导弹。尽管美英法是利用巡航导弹等武器发动远程空袭,但叙军要对等还击却几乎是“不可能完成的任务”。目前叙军仍能作战的战机仍是老旧的苏制米格-29、米格-23、米格-21战斗机和苏-22、苏-24轰炸机,它们在现代化的西方空军面前难有自保之力,因此叙军的远程反击只能依靠另一个撒手锏——地对地战术弹道导弹。"""# 关键词提取所使用停用词文本语料库可以切换成自定义语料库的路径。analyse.set_stop_words("stopwords.txt")# 引入TextRank关键词抽取接口textrank = analyse.textrank# 基于TextRank算法进行关键词抽取keywords_textrank = textrank(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz'))# 输出抽取出的关键词for keyword in keywords_textrank:print (keyword + "/")print ("TFIDF")# TFIDFkeywords_tfidf = analyse.extract_tags(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz'))# 输出抽取出的关键词for keyword in keywords_tfidf:print (keyword + "/") 叙军/ 远程/ 空袭/ 电视台/ 战术/ 反击/ 空军/ 现代化/ 叙利亚/ 地对地/ TFIDF **************************************************** 叙军/ 地对地/ 空袭/ 弹道导弹/ 远程/ 叙利亚/ 电视台/ 反击/ 战术/ 撒手锏/看来要重新认识一些jieba
与50位技术专家面对面20年技术见证,附赠技术全景图总结
以上是生活随笔为你收集整理的使用jieba 提取 关键词的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 有机化学芳烃 芳香性
- 下一篇: 近邻算法分类