当前位置:
首页 >
jieba提取关键词时筛选词性时单词性选择的一点注意事项
发布时间:2023/12/20
45
豆豆
生活随笔
收集整理的这篇文章主要介绍了
jieba提取关键词时筛选词性时单词性选择的一点注意事项
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
最近又在迭代特征工程,发现jieba提取特征词有个需要注意的地方,直接看例子
例子1
>>> import jieba >>> import jieba.posseg as pseg >>> s = '我们喜欢支付宝, 苹果' >>> ws = pseg.cut(s) >>> for i in ws: ... print i ... 我们/r 喜欢/v 支付宝/nr ,/x/x 苹果/n >>> allow_pos = ('nr',) >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 支付宝>>> allow_pos = ('nr') >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 苹果 我们allow_pos = (‘nr’,) 带逗号,allow_pos是tuple, 结果只选取’nr’词性的词
allow_pos = (‘nr’), allow_pos是一个string, 结果选取了’n’ 和’r’的词性
这个差别造成了关键词提取方法中词性选取的差异
总结
以上是生活随笔为你收集整理的jieba提取关键词时筛选词性时单词性选择的一点注意事项的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: Android开机速度优化
- 下一篇: Pig 安装