- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文本分析的微博用户性格获取模型(科技创新资料) 文档信息 : 文档作为关于“IT计算机”中“数据挖掘与模式识别”的参考范文,为解决如何写好实用应用文、正确编写文案格式、内容素材摘取等相关工作提供支持。正文11288字,doc格式,可编辑。质优实惠,欢迎下载! 目录 TOC \o 1-9 \h \z \u 目录 1 正文 2 文1:基于文本分析的微博用户性格获取模型 2 1 微博数据的获取 2 2 微博用户性格分析的实现 3 2.1 行为标签词库的构建 3 2.2 行为——性格关系映射表的建立 3 2.3 用户性格获取模型的构建 4 3 模型科学性的检验方法及优化 5 4 基于用户性格的个性化推荐方法 6 5 结语 6 文2:基于文本分析的网络人物观点识别研究 6 1 文本分析法概述 9 2 词汇库的建立 10 3 文本的预处理 11 2)其次对匹配出的3种分句标点符号的后边均加入一个回车符; 12 3)将queue中的引号内容依次替换回去; 12 5)根据回车符划分句子并加入到List中。 12 1) 设置默认返回的观点持有者的id为-1; 13 2) 抽取某语句中的全部候选观点持有者; 13 4)循环结束后,返回id。 13 1) 一位中国地震局的专家:前边为量词、名词、形容词等; 14 2) 杜甫的妻子:后边为“的”、nr、defnr等; 14 4) 其他情况。 14 5 结果分析 14 6 结 语 17 参考文摘引言: 17 原创性声明(模板) 18 文章致谢(模板) 18 正文 基于文本分析的微博用户性格获取模型(科技创新资料) 文1:基于文本分析的微博用户性格获取模型 随着21世纪信息技术的快速发展,以及人们对于电子产品的日益依赖,微博从早期传播即时发布消息、用户评论的舆论平台,到如今新闻传播的高效渠道,微博已经成为了一个较为多元化的综合平台,并最终逐渐成为表达现代人精神乃至情感方面的媒体。 在企业日益认识到微博对企业品牌价值影响这一背景下,微博作为近些年广受欢迎的社交网络平台,其使用用户的性格特征一直深受社会各界广泛关注。目前通过微博内容特征确定用户性格的研究基本停留在表象层面,尚未合理深入到用户的性格特征的研究层次。本文以传统词频分析法生产用户常用微博行为标签为基础,通过建立行为——性格对照表以及用户行为性格分析模型,提出一种基于用户微博内容的用户性格分析方法。 1 微博数据的获取 获取微博用户发布内容的方式主要有两种:一是通过网络爬虫爬取客户微博中所有的用户数据,然后在获取数据中提取用户发布内容;二是通过新浪微博的开放平台API直接获取站点服务器上的用户数据和发布内容。这两种方法获取微博数据都存在获取数据有限的弊端,但整体看来利用python编写爬虫程序获取微博用户发布内容相对较好。该方法实施步骤为:注册一个微博账户,然后用该注册账户关注所需抓取的目标用户的微博;分析新浪微博网页结构,利用python编写网络爬虫程序,并加载urlib库;将抓取的微博用户数据存入数据库中。 通过以上步骤,最终可以实现通过模拟浏览器行为获取页面标签,抓取新浪微博用户所发的微博内容、用户粉丝和关注数据,并将获取数据存储在指定数据库中。 2 微博用户性格分析的实现 2.1 行为标签词库的构建 微博用户在微博中的行为无外乎转发微博、发送原微博、评论、浏览这四种行为。用爬虫软件或开发商提供相应的接口程序抓取的大量微博用户数据后,可经过数据提取的方式获取用户发布内容,并选用特定的分词系统将微博用户发布内容进行分词;然后依据用户在微博中的行为,通过词频分析从用户发布内容中抽出能够代表某一行为的名词或者动作(可依据微博用户行为动作相关的词库进行人工判断或者运用相关软件进行抽词分析);并根据行为行为学、心理学等相关理论基础规范化这些抽取名词或者表达动作(在不损坏该词原有含义的情况下进行修正或者规范化),从而形成具有一定表现用户转发、评论、发表某微博当时动作或者心理状态的标签词。在创建行为标签词库过程中,如果某两个词之间具有近似含义,则可通过相关性程度判断的方法进行近似判断,进而规定其从属范围或者选用一个词作为标签代表与其含意相近的一类词。 2.2 行为——性格关系映射表的建立 通过行为标签词库的建立可以实现对微博用户发布内容及其行为的揭示,但微博用户发布内容及其行为与其性格的关系需要行为——性格关系映射表进行对应阐释。所建立的行为——性格关系表,主要功能是可以实现针对人类发出某个社会性动作(包括评论、直接的言语表达、对部分微博转发等动作),通过查找表中行为——性格的对应关系
文档评论(0)