- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
BUAA-SANLP
任务-1分类特征选择(续) F1:情感词(可含话题相关情感词) F2:不规范标点[Y] F3:否定词 F4:程度词 F5:表情符号 F6:特殊符号[N] F7:叹词与带有情感色彩的标点融合 F8:主张词 F9:第一、二人称代词 F10:祝愿、但愿、希望等表达愿望的词 F11:程度词+情感词 F12:否定词+程度词+情感词 F13:其它融合特征或者其它特征 任务-2分类特征选择(续) 句子中表情符号个数 积极表情符号的个数 消极表情符号的个数 句子是问句、陈述句、还是感叹句。。。。 情感词对应的词性标记分别为{n, v, a, z, d}的个数 情感词对应的词性标记分别为{n, v, a, z, d}的情感极值和 积极词个数 消极词个数 句子的情感词极值和 否定词的个数 感叹号个数 问号个数 非情感词的各类词性标记个数n、t、s、f、v、a、b、z、r、m、q、d、p、c、u、e、y、o、h、x、w 主题相关的情感词个数 {n, v, a, z, d}等话题相关的情感词对应词性标记的个数 句子包含target数量 话题总体情感倾向 话题正面情感倾向 话题负面情感倾向 任务-3:情感要素抽取 候选评价对象生成 判断句子中是否包含话题相关的评价对象,如果有则直接选用它作为候选评价对象 如果没有,则对句子中的所有可能的评价对象(主要是词性为n的词)进行分类 观察候选评价对象的个数,如果为0,则选择hashTAG中出现的名词作为唯一的候选评价对象 任务-3:情感要素抽取(续) 识别句子中的评价词 观察句子中是否有强烈的情感词(强情感词定义为程度为4和5的词),如果有则直接作为候选, 如果没有则把句子中情感词作为可能的评价词,如果其个数小于等于2则直接将它们作为候选,如果大于2,则进行分类 任务-3:情感要素抽取(续) 生成所有候选搭配,并输出最佳结果 如果候选搭配个数小于等于2,则直接输出结果 如果候选数量大于2,则对所有候选进行分类 分类特征包括 任务-3:情感要素抽取(续) 分类特征 评价对象是否在hashtag中出现 评价词是否为主题相关的评价词 评价对象与评价词之间的的依存关系 评价词极值 评价词是否与程度词存在依存关系 评价词是否与形容词存在依存关系 评价词是否与副词存在依存关系 评价词前后词汇及其词性 评价词是否存在否定依存关系 评价词一定窗口(窗口大小可设为2)内是否出现讽刺性词语。 候选搭配的个数 句子中表情符号个数 积极表情符号的个数 消极表情符号的个数 思考 话题的倾向性太强? 训练集、测试集的主观性太强? 在应用中如何提高用户的满意度? 附录 北航计算机学院 信息安全与智能信息处理实验室 研究方向: 机器翻译、情感分析、自然语言处理 文本挖掘、机器学习 信息安全、内容安全、舆情分析 联系 北航新主楼G1001/G930 chaowenhan@; 010(O) 欢迎各位专家莅临指导 总结 BUAA-SA系统参加了三个评测子任务 主要的特点在于 情感词的处理 细节的处理 话题适应性 主要参考文献 Guang Qiu, Bing Liu, Jiajun Bu and Chun Chen. Expanding Domain Sentiment Lexicon through Double Propagation, IJCAI 2009. Valentin Jijkoun, Maarten de Rijke and Wouter Weerkamp. Generating Focused Topic-specific Sentiment Lexicons, ACL 2010. 赵妍妍, 秦兵, 刘挺.文本情感分析综述. 2009. 许洪波,孙乐,姚天昉(主编).第三届中文倾向性分析评测(COAE2011)论文集. 中国科学院计算技术研究所,2011. 谢谢!Thank you very much! Thanks to Brendan O’Connor and Noah Smith (email, 1/18/12) for permission to use this figure. * Thanks to Brendan O’Connor and Noah Smith (email, 1/18/12) for permission to use this figure. * Thanks to Brendan O’Connor and Noah Smith (email, 1/18/12) for permission to use this figure. * Thanks to Brendan O’Connor and Noah Smith (email,
文档评论(0)