欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

基于中文主观性知识库的句子主观性计算项目

发布时间:2024/7/5 编程问答 65 豆豆
生活随笔 收集整理的这篇文章主要介绍了 基于中文主观性知识库的句子主观性计算项目 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

ChineseZhuguanDectection

项目地址:https://github.com/liuhuanyong/ZhuguanDetection
Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主观性知识库的句子主观性评定方法。

#项目介绍
主观性是中文舆情和文本挖掘一个必不可少的一项环节。
对于英文而言,我调研过textblob的主观性接口,对于输入一个句子,textblob用的是词语主观性词典+加权的打法,相应的介绍可以查看我的总结材料(documents下的pdf文件)
而针对目前github开源平台上还缺少有对中文句子主观性评定的接口,本项目将尝试弥补这一空缺。
本项目将从中文自身的特点出发,通过总结并挖掘中文句子主观性线索知识库和客观性线索知识库,提供一个面向中文句子的主观性判定方法。

主观性字典

  • degree_words.txt:程度副词,221个
  • deny_words.txt:否定副词,29个
  • lianci_words.txt:连词,93个
  • nengyuan_words.txt:能愿副词,719个
  • pingjia_words.txt:评价词,6846个
  • qingtai_words.txt:情态动词,29个
  • rencheng_words.txt:人称代词,32个
  • senti_words:情感词,2090个
  • tanci_words:叹词,139个
  • yiwen_words:疑问代词,26个
  • yuqi_words:语气词,17个
  • zhishi_words.txt:指示代词,64个
  • zhuangtai_words.txt:状态词,49个
  • zhuzhang_words.txt:主张词,235个
  • 主观性计算规则

  • 文本分句
  • 计算每个句子的主观性。
  • 每个句子主观性计算方式:主观线索词*主观线索词权重,做加权累加和平均
  • 每个句子主观性求平均
  • 输出文本主观性
  • 使用方式:

    from zhuguang import * handler = ZhuguanDetect() sent = '''你要分析的文本''' score = handler.detect(sent) print(score)

    效果

    content = '今天天气晴朗' score = 0.0 ********************** content = '江龙船艇:台风“山竹”造成直接经济损失400万至500万' score = 0.09375 ********************** content = '中华人民共和国万岁' score = 0.200 ********************** content = '这两天经济不景气,恐怕这单子有得毁掉了' score = 0.2092 ********************** content = '9月底美联储再次加息几乎板上钉钉,央行大概率小幅跟随加息,与此同时的定向降准对冲显得更为重要。预计10月前后可能再次实施定向降准措施。' score = 0.237 ********************** content = '预计明后两天江西会有大到暴雨' score = 0.36 ********************** content = '我喜欢你' score = 0.767 *****************************

    总结

    1)本项目以词汇知识库的方式,通过总结归纳出主观性线索词,并加以规则进行计算。
    2) 从上面的效果来看,还像是那么回事,但还有提升空间。
    3) 主观性配合情感得分,相信能够在舆情分析上起到一定作用。
    4)词库欢迎补充。send mail to: lhy_in_blcu@126.com

    项目地址:https://github.com/liuhuanyong/ZhuguanDetection
    If any question about the project or me ,see https://liuhuanyong.github.io/

    总结

    以上是生活随笔为你收集整理的基于中文主观性知识库的句子主观性计算项目的全部内容,希望文章能够帮你解决所遇到的问题。

    如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。