基于Wikidata和标签云的有哪些信誉好的足球投注网站算法研究.docVIP

基于Wikidata和标签云的有哪些信誉好的足球投注网站算法研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Wikidata和标签云的有哪些信誉好的足球投注网站算法研究   摘 要:知?R库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进行标签化处理,并将转换得到的标签向量应用于信息检索和页面排序。首先,提取Wikidata中的结构化数据,构建以实体为单位的标签云;然后,将需要检索的文档和用户的检索语句映射为相应的标签,并采用处理向量的相关方法实现网页的排序算法;最后,采用信息检索常用的标准对该算法进行验证。实验结果表明,与传统的基于关键词的有哪些信誉好的足球投注网站方法相比,新算法在一定程度上能够提高页面排序的准确率。   关键词关键词:知识库; Wikidata; 网页检索; 页面排序; 标签云; 有哪些信誉好的足球投注网站引擎   DOIDOI:10.11907/rjdk.161447   中图分类号:TP312   文献标识码:A 文章编号:1672-7800(2016)008-0042-04   0 引言   信息呈现几何式爆炸增长,面对如此庞大的信息数量,有哪些信誉好的足球投注网站引擎成为互联网的绝佳入口。目前主流的有哪些信誉好的足球投注网站引擎算法仍以关键词的匹配程度检索,但是相同的词语在不同的语境中有着不同的意义,而不同的人对同样的词语也会有不同的理解, 因此简单地基于关键词的有哪些信誉好的足球投注网站引擎既不能识别出关键词的意义,亦不能从语义的角度进行结果排序。在网页排序算法方面,诸如著名的PageRank[1]、HITS[2]以及结合前两者的SALSA[3]算法都是根据网页间链接的关系进行排序的。 如果仅考虑网页间的链接结构来分析页面的权威性,就容易忽视页面的具体内容并且剥离有哪些信誉好的足球投注网站语句和最终有哪些信誉好的足球投注网站结果之间的联系,从而影响有哪些信誉好的足球投注网站的查全率和查准率。   知识库是一种用来储存结构化知识的数据库。 Wikidata是一个自由、开放、协作的知识库[4],Wikidata不仅存储对实体的描述,还存储着这些描述的来源和实体间的联系,以结构化的形式存储所有的数据,计算机能够极其便利地获得和处理这些数据。Wikidata拥有超过280种不同语言的知识库数据,尽管对各种语言覆盖的程度不一,但其中的英文内容极其丰富,对于中文也有着不错的支持。Wikidata依托于维基媒体基金会,采用类似于维基百科的管理和编辑方式,能够广泛且准确地反应出用户对实体的理解。本文研究了Wikidata知识库中存储的数据及其结构,提出了一种基于Wikidata和标签云的有哪些信誉好的足球投注网站算法。   本文创新内容包括:①提出一种以知识库为基础构建标签云的方法;②将TF-IDF算法与标签云相结合,提出TC-ITF算法用于计算标签特征权重;③提出基于标签云的网页有哪些信誉好的足球投注网站算法。   1 相关工作   1.1 知识库相关应用   有哪些信誉好的足球投注网站引擎方面,知识库主要应用在知识图谱上。 例如在谷歌的知识图谱[5]中,它能根据各种知识库中的联系为用户提供拥有完整知识体系的有哪些信誉好的足球投注网站结果。这样虽然能摆脱链接分析的禁锢,开辟一种直接提供知识或信息的方式,但是其结果只是在一定体系中的内容,超出该体系结构的知识或信息仍然需要通过有哪些信誉好的足球投注网站其它网站获得。它还垄断图谱的内容、控制结果的权威性。 因此,利用知识库来改进以检索网页为基础的有哪些信誉好的足球投注网站算法仍有很大的发展空间。   1.2 基于标签的排序算法   以标签的形式进行网页排序的方法主要利用社会性标注形成的四元组,相关的算法有Bao等[6]提出的SocialSimRank算法、Hotho等[7]提出的FolkRank算法、Noll等[8]提出的SPEAR算法以及刘凯鹏等[9]提出的利用二部图模型的基于社会性标注网页排序算法等。这类算法都是以名为Folksonomy的社会性标注数据为基础提取相应的内容。Folksonomy描述了用户、资源、标签以及用户对资源分配的标签,形成了如下定义,F:=(U,T,D,R),其中U、T、D分别代表用户、标签、资源或文档,R是前三者的关系,即r=(u,t,d),标识用户u对文档d标注了标签t,用于有哪些信誉好的足球投注网站引擎的数据主要来自书签分享网站del.icio.us。这类排序方法存在两个缺陷: ①由于用户可以随意定义标签且语言习惯不同,标签的内容不够规范,准确性有一定欠缺;②覆盖的资源不足,用户很可能只对一个网站的主域名标记标签,而不会对网站中的每一个页面都完成标签操作,而实际的检索过程需要精确到具体页面。   若直接使用标签向量来表示页面,那么向量中的每一个元素的地位都相同,这与实际不符。因此需要在页面和标签之间建立相关的主题模型,采用诸如TF-IDF[10]、LSI[11]或LDA[12]等主题模型算法。   2 基于Wikidata和标签云的网页有哪些信誉好的足球投注网站框架   本文提出一种基于Wikidata和标签云的有哪些信誉好的足球投注网站算法,其框架如图1所示。   该框架流程分为两个部分:   (1)数据预

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档