利用关联数据实现机构知识库的语义扩展方法研究结题演示报告.pptVIP

利用关联数据实现机构知识库的语义扩展方法研究结题演示报告.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * 利用关联数据实现机构知识库的语义扩展方法研究 项目总指导:祝忠明 项目负责人:王思丽 项目组成员:姚晓娜 卢利农 刘魏 兰州分馆信息系统部 青年人才领域前沿项目结题报告 * * * 提 纲 1.项目完成情况 2.研究主要成果 3.存在问题及拟采取措施 3.经费及使用情况 * * * 1.项目完成情况1 项目实施路线 * 1.项目完成情况2 关联数据的相关技术进展研究 直接创建和发布静态的RDF文档:FOAF-a-matic、FOAFaMaticMark2 将其他类型的数据转换为RDF格式 扩展已有API抓取和关联RDF数据:Google、Yahoo、 GovWILD 将关系数据库公开为RDF接口 * 1.项目完成情况3 关联数据的相关技术方法对比分析 序号 技术方法分析 应用场景分析 ① 这种方式比较简单,一般多依赖于用户或兴趣团体手工创建或者使用较为简单的软件进行转换输出。一般只需按照软件的提示进行操作,有的时候可能需要为非信息资源对象设置相应的URI,配置标准的多用途互联网邮件扩展的类型。一般只是简单的html页面(jsp、php、asp)或者简单的java小工具。 通常适合数据量较少、对数据规范要求不太严格、不占用较大的服务器空间、只需简单存储或可将较大的文件拆分存储和发布、也不需要经常更新的情况。最常见的应用就是发布个人的FOAF文件或者RDF词表等。 ② 是RDF化的一些小型工具,可将PDF、Word、Visio、CSV、Excel、BibTex、Flickr等传统格式的数据转换成RDF格式,术语统称为RDFizer。一般采用java、C语言或C++语言开发。 该方法适合于数据格式严格规范、数据量较大但可拆分、数据存储模式相对简单的情况,借助工具能够进行批量转换,减少人工创建所花费的开销,提高转换的效率和准确率。 ③ 利用关联数据可以对这些已有的API进行扩展,并为一些非信息资源分配一定的URI,当以Application/RDF+XML格式进行查询请求时,可以获取到RDF格式的结果数据,以便机器进行自动处理。同时可以通过解析抓取到的RDF中的URI关联到其他外部数据源的数据。 适合数据量多,数据格式复杂,数据流通性比较快捷的一些项目,主要是有哪些信誉好的足球投注网站引擎或者门户型网站平台等。如Google and Google Base,eBay,Yahoo,Amazon等主流应用平台一般都有自己的API,提供了多样化的查询、检索接口以及多种格式的返回结果(如XML、JSON或Atom)等,造成了一般数据浏览器访问的困难和有哪些信誉好的足球投注网站引擎抓取数据的不便。因而可以关联数据格式整合和可视化各种数据,丰富其检索结果和服务。 ④ 一般由大型的软件公司或实验室开发,如Openlink的Virtuoso,惠普实验室的Joseki(Jena),通常使用了较为复杂的本体建模技术,如RDF和OWL,可以处理XML、RDF、ODB和关系数据库存储,以及web服务和应用程序服务器。能够将关系数据库中的数据公开为虚拟RDF视图,从而作为一个SPARQL端点被用户浏览和访问,并进行一定的查询和推理。 适用于各种关系型数据库。都提供了通用的机制,仅仅需要修改和进行一些配置就可以投入使用,使得将关系数据库快速公开为一个RDF知识库的过程变得相对简单和可行。但对于数据模式比较复杂或者数据模式没有正确定义,亦或者数据库中含有不一致性数据的关系数据库,在将其进行处理并转换为RDF的过程中需要根据实际情况加入额外的处理步骤。 * * * 1.项目完成情况4 项目名称 项目网址 所属领域 oreChem /oreChem 化学 Bio2RDF / 生物学 LODD /wiki/HCLSIG/LODD 医学 JISC http://www.jisc.ac.uk/whatwedo/topics/resourcediscovery.aspx 教育学 LIBRIS http://libris.kb.se/index.jsp?language=en 数字图书馆 Europeanna http://www.europeana.eu 数字图书馆 Library of Congress ./index.html 数字图书馆 * * * 1.项目完成情况4 项目名称 技术方法及应用效果分析 oreChem 依赖于一个核心数据模型(即本体)去描述和标示化学科研实体以及它们之间的相互关系,然后根据该数据模型将已有的化学数据关联扩展到各种外部化学数据源,建立不同数据提供者之间的联系,从而增强化学数据的结构化检索。 Bio2RDF 主要运用了Sesame的开源三元组存储技术和OWL本体,将

文档评论(0)

3388813 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档