面向电子商务在线评价的细粒度情感分析研究.docVIP

面向电子商务在线评价的细粒度情感分析研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向电子商务在线评价的细粒度情感分析研究

精品论文 参考文献 面向电子商务在线评价的细粒度情感分析研究 长安大学经济与管理学院 陕西西安 710000 摘要:在线评价是消费者进行购买决策的重要依据,为了挖掘利用在线评价大数据,本文提出细粒度情感分析模型,总结模型各任务的研究方法,指出其对电子商务平台的推荐系统和评价管理系统的优化,对电商企业产品或服务优化和消费者行为分析。 关键词:情感分析 细粒度 文本挖掘 在线评价 电子商务 前言 2015年年底中国网民规模达 6.88 亿,天猫交易平台仅双十一当天成交量达到912亿元,电子商务活动已成为新经济发展的引擎之一。Jupiter Research公司调查显示有超过 75%的消费者在线购买商品之前,会参考互联网用户所写的产品评价信息[1]。由于在线评价已成为消费者费者决策的重要支撑,在线评价的挖掘对企业的和电子商务平台均有一定的指导作用,目前对在线评价内容特征的研究主要包括评价长度[2]、评价极性[3]、评价质量[4]、评价得分[5],但在评价语义方面研究不够深入。情感分析作为文本挖掘的一个新兴领域,能够从在线评价的语义和情感角度出发,挖掘评价对象的属性特征和情感强度。它涉及数据挖掘、自然语言处理、信息检索、机器学习等多个学科领域的问题,将它引入在线评价分析,提供决策支撑。 1情感分析 情感分析(sentiment analysis),又称观点挖掘或意见挖掘(opinion mining),指通过自动分析某种商品评价的文本内容,发现消费者对该商品的褒贬态度和意见。[6-7]按照处理文本的粒度不同,情感分析可分为词语或短语级、句子级、篇章级[8]。面向句子级、篇章级的粗粒度情感分析较为成熟,但它一般从整体来判断文本的情感极性,不能针对评价对象的具体属性进行分别计算情感强度,导致电子商务中企业不能了解消费者的个性化需求。而词语级、短语级的细粒度情感分析能抽取评价对象及评价对象的情感倾向等要素,反映更具针对性的情感信息。 2基于细粒度情感分析的评价挖掘模型构建 对于在线评价的情感分析已经成自然语言处理、文本挖掘等热点之一,针对微博、大众点评、淘宝等平台均有应用研究。拟构建的基于细粒度情感分析的评价挖掘模型如图1,通过获取对电子商务平台上消费者评价,处理数据。该模型分为五个任务:数据准备、评价对象的抽取和分类、情感倾向性分类、搭配抽取、情感强度计算。 图1 细粒度情感分析评价挖掘模型 2.1数据准备阶段 此任务需要在目标电子商务平台利用文本挖掘技术获取源数据,并进行数据处理,此阶段的技术已经很成熟。主要利用网络爬虫工具进行数据获取,在爬取网页后对目标内容进行解析。国内目前一些文本采集软件如集搜客、火车头采集器等可以方便的获取数据。由于爬取的在线评价中可能包含无意义字符、与主题不相关的广告等,需要对数据进行预处理为便于研究的结构化数据。对在线评价预处理的方法包括:词性标注、词缀修剪、简化替换分词和停用词的过滤[9]。常用软件如ICTCLAS、LJParser、ROST等完成部分预处理任务。 2.2评价对象的抽取与分类 评价对象主要指产品或服务的属性,也叫特征或属性,如手机产品中的“尺寸”、“价格”,酒店服务的“床”、“交通”。评价中特征分为显示特征和隐示特征。如“这手机发热严重”和“这手机我都可以用来煎鸡蛋”,前者对使用性能特征直接进行描述,后者需要句子进行语义理解才能得到抽取。目前自然语言处理技术还很难达到深刻理解句子语义的程度,因此绝大部分特征的抽取都只考虑了产品的显式特征[10]。特征抽取的方法有两种,基于词典的特征抽取和基于语料的特征抽取。在抽取之后,需要进行分类,而且不同类型的产品特征划分有所不同。如“尺寸”和“大小”都属于同一特征,一般是通过词典匹配的方法来归类,另一种方式则是用机器学习的方法。 2.3评价观点的抽取 评价观点也就是句中的情感词,如“漂亮”、“不喜欢”等。评价观点的抽取是将表达消费者的态度的词语或短语抽取,进而分析情感倾向,细粒度情感分析重点在情感词的情感倾向上。在进行评价观点抽取与分析之前需要进行主客观文本分类,细粒度情感分析是对主观文本进行分析。如“我当初试买的这手机”只是在陈述一个客观事实。在对大量的在线评价进行主客观文本识别后,能够有效地缩小分析范围,减少干扰[11]。 情感词的情感倾向性一般是褒贬二元分类,但是根据研究领域和研究对象有不同分法,如崔大志根据市场营销学和心理学将情感分成7类[12],Goldberg将评价的情感分为4类[1

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档