基于依存分析的中文微博情感分析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 任务3情感要素抽取评测共有15个单位提交了22组结果,此表给出了严格评价指标下本组结果与任务3所有组的结果平均值和最好值比较 。 * 在严格评价指标下微平均和宏平均评测结果如图所示,其中红色方框部分是采用本文提出的SFE_DM方法参加任务3情感要素抽取(严格评价指标)评测结果。 从此图和上表中可以看出,SFE_DM方法在22组提交结果中名列前茅,微平均和宏平均的准确率、召回率和F值都排名第3。排名靠前的结果中分别有两组来自同一个单位,即SFE_DM方法在15个单位的提交结果中,微平均和宏平均的准确率、召回率和F值都排名第2,F值正好是平均值的2倍。这个结果表明了SFE_DM方法通过定义6种评价单元依存模式并对情感对象进行归并能够抽取出完整的情感要素,除中国传媒大学国家语言资源监测与研究中心外比其它13个单位所用方法更有效。 * 严格评价指标下本组结果与任务3所有组的结果平均值和最好值比较 如表所示。 * 在宽松评价指标下微平均和宏平均评测结果如图所示,其中红色方框部分是采用我们提出的SFE_DM方法参加任务3情感要素抽取(宽松评价指标)评测结果。 宽松评价指标评测存在误判率高的问题,如在例句“ipad的屏幕很棒!”中,抽取出“ipad的屏幕”中的任意词语或短语都算正确,包括“ipad的”、“的”、“的屏幕”等非情感对象。故综合来看,宽松评价指标并不能作为情感要素抽取任务的准确评测依据。 对比严格评价和宽松评价指标下的结果我们发现,我们提出的SFE_DM方法在宽松评价指标评测中,微平均的F值是严格评价中F值的1.276倍,宏平均是1.268倍。计算22组结果的微平均F值平均值在宽松评价中是严格评价中的F值的1.607倍,宏平均是1.580倍。这两组结果说明了SFE_DM方法的F值在宽松评价指标评测中的提高率比平均值的提高率低,进一步表明了SFE_DM方法采用依存树的归并来得到完整的情感对象是有效的。 海军工程大学信息安全系 中文微博情感分析评测 海军工程大学信息安全系 中文微博情感分析评测 基于依存分析的 中文微博情感分析 汇报人:周学广 教授 E-mail:zxg196610@ 汇报内容 任务一 观点句识别评测 任务二 情感倾向性判断评测 任务三 情感要素抽取评测 任务一:观点句识别评测 为了有效区分观点句与非观点句,我们从句子中抽取组件对应的词语特征作为识别线索,并在情感词和评价对象的依存模式的基础上,提出基于词语特征的观点句识别方法--OSR_WF方法。 任务一:观点句识别评测 OSR_WF方法流程: 新词识别; 含极性词库中的词,则认为该句子是观点句; 主语为第一人称代词,谓语为主张动词,状语为表达“喜、 ?? ?? ??怒、哀、乐”的情感词的句子认为不是观点句; 含有能愿动词库中的词作谓语的句子认为不是观点句; 由条件连词库中的词作连词的句子认为不是观点句; 其它符合评价单元依存模式的句子认为是观点句。 规则制定: 制定组合模式 构建非语素词性集 构建停用词表 候选新词剪枝: 成词权重统计: 转移频率和文档频数,计算成词权重: 提出基于规则与统计的新词识别方法 任务一:观点句识别评测 情感词库 极性词库 否定词库 能愿动词库 条件连词库 词库构建: 任务一:观点句识别评测 评价单元依存模式 评价单元模式 情感词词性 评价对象词性 VA, VV NN, NR, NT, PN VA, JJ NN, NR, NT, PN VA, VV NN, NR, NT, PN VA, VV NN, NR, NT, PN VA, JJ NN, NR, NT, PN VA, JJ NN, NR, NT, PN 任务一:观点句识别评测 结果编号 微平均 宏平均 准确率 召回率 F值 准确率 召回率 F值 17 0.828 0.537 0.651 0.826 0.520 0.629 平均值 0.727 0.615 0.647 0.727 0.607 0.634 最好值 0.835 0.959 0.784 0.836 0.96 0.783 任务一:观点句识别评测 任务二:情感倾向性判断评测 线性相加法 统计观点句中情感倾向性值,句子从左往右,含褒义情感词+1,含贬义情感词-1,出现“但、但是”连词,将情感倾向性值清零,从转折后继续计算,最后得到句子的倾向,大于0判断为POS,小于0判断为NEG,等于0为OTHER。 结果编号 微平均 宏平均 准确率 召回率 F值 准确率 召回率 F值 17 0.772 0.415 0.54 0.776 0.404 0.523 平均值 0.745 0.455 0.552 0.744 0.450 0.54 最好值 0.93 0.

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档