欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

jieba提取关键词时筛选词性时单词性选择的一点注意事项

发布时间:2023/12/20 45 豆豆
生活随笔 收集整理的这篇文章主要介绍了 jieba提取关键词时筛选词性时单词性选择的一点注意事项 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

最近又在迭代特征工程,发现jieba提取特征词有个需要注意的地方,直接看例子

例子1

>>> import jieba >>> import jieba.posseg as pseg >>> s = '我们喜欢支付宝, 苹果' >>> ws = pseg.cut(s) >>> for i in ws: ... print i ... 我们/r 喜欢/v 支付宝/nr ,/x/x 苹果/n >>> allow_pos = ('nr',) >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 支付宝>>> allow_pos = ('nr') >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 苹果 我们

allow_pos = (‘nr’,) 带逗号,allow_pos是tuple, 结果只选取’nr’词性的词
allow_pos = (‘nr’), allow_pos是一个string, 结果选取了’n’ 和’r’的词性
这个差别造成了关键词提取方法中词性选取的差异

总结

以上是生活随笔为你收集整理的jieba提取关键词时筛选词性时单词性选择的一点注意事项的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。