- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质组学元数据仓库的管理与维护
蛋白质组学元数据仓库的管理与维护 摘 要:在针对生物数据源具有的分布、异构和动态等特性下,建立的蛋白质组学元数据仓库的基础上,本文给出了删除元数据的方法,以及解决了由于删除元数据和生物数据源更新而带来的元仓库中元数据的变化,而引起的用户模式与元数据的映射不匹配等问题。 关键词:删除;元数据;生物数据源 Proteomics data warehouse management and maintenance Abstract: In response to biological data source has the distribution, heterogeneous and dynamic characteristics, establishment of a proteomics metadata of data warehouse based on, This paper presents a method to remove metadata, and solve remove metadata and biological data source update metadata warehouse metadata changes caused by user-mode metadata mapping does not match the other issues. Keywords: Deleted; metadata; biological data sources 基金项目:国家高技术研究发展计划(863计划)资助(2006AA02A312) Foundation Item:Supported by National High Technology Research and Development Program of China (2006AA02A312) 1 引言 随着科技的不断进步,人类对生物信息学的研究也在不断地深入。为了应对生物技术高速发展而引发的数据存储、分析等的应用需求,新的数据库不断建立,存储的数据呈指数级增长(图1),研究人员需要的数据也开始不只限于某个单一数据库,而是分散在多个相关数据源中[5]。对高度复杂的海量实验数据进行存储、共享与整合成为了生物信息学研究中最重要的问题之一。目前各个大型生物数据库是由不同的研究机构在不同技术与科研条件下根据其自身的需要建立的,研究或应用的背景也各不相同,从而形成语法、语义、模式等方面的异构[1]。除此之外,这些数据库大都具有分布、自治和动态的特点,给科研人员的访问和使用带来了极大的影响。伴随着研究发展而新出现的生物数据库也有类似的问题。诸多的异构数据源严重影响了数据的共享与整合,给研究工作造成了许多困难。 图1主要生物数据库规模呈指数级增长趋势图[2] 多年来,人们试图通过各种办法来解决数据整合的问题。联邦数据库、中间件和数据仓库等技术在不同的着重点和应用上部分的解决了数据共享问题,然而数据源模式异构的问题还是没有从根本上得到解决。元数据是关于数据的数据,是对数据源所存储数据的详细描述,不仅包含了数据的名称、类型等信息,还提供了数据的上下文描述信息,例如数据的来源、取值范围、业务规则等。如果将各数据源的元数据按照一个统一的标准提取出来集中存放在一个元数据库中,并映射到按照用户的查询要求而建立的用户模式上,就能够通过解析用户模式得到对应的各数据源模式查询;对各数据源查询结果进行连接、合并等操作,并按用户模式进行输出,就能够实现数据的共享和整合。基于以上分析,我们提出了基于元数据的蛋白质组学数据资源共享与整合方案,本文讨论的内容是元仓库的管理与维护,主要是在元仓库的基础上删除元数据的方法,并解决由于删除元数据和生物数据源更新而带来的元数据的变化,以及在这种情况下如何解决用户模式与元数据的映射等一系列问题。 2工作基础 在引言部分中已经介绍过,元数据包含了对数据源中数据的详细描述。因此,通过抽取各数据源的元数据,可以对要集成的数据源在结构上有一个更直观的认识。与数据仓库的集成方法相比,使用元数据进行数据集成有以下特点:(1)元数据库中存储的是各数据源的结构信息,按照统一的元数据标准进行描述后集中存放在元数据库中,能够保持各数据源的结构特征。(2)建立元数据库所抽取的多个数据源的元数据与海量的实验数据相比存储压力要小得多,而且由于各数据源的结构相对稳定,元数据更新频率远低于数据更新频率,同时在查询时是通过元数据直接访问相关的数据源,能够保证查询效率和结果的准确与全面。 公共仓库元模型(Common Warehouse Metamodel, CWM)是一个完整的描述数据仓库和业务分析领域的元模型,提供了构建元数据所需的语法和语义。CWM元模型具有良好的树状
您可能关注的文档
最近下载
- 《宴席设计实务》课业设计 课程设计 教案.pdf VIP
- GB_T37755-2019智能变电站光纤回路建模及编码技术规范.docx VIP
- EZVIZ萤石智能锁 执手系列-DL20系列CS-DL20VS-BrB1NE说明书用户手册.pdf
- 2025年人教版英语中考复习不定代词either,neither,both,each和every的用法课件.pptx VIP
- 2025新疆投资发展(集团)有限责任公司及所属公司招聘71人笔试参考题库附答案解析.docx VIP
- 2025年安徽省网络和数据安全职业技能大赛(数据安全管理员)备赛试题库(含答案).docx
- 2025新疆投资发展(集团)有限责任公司及所属公司招聘71人笔试备考试题及答案解析.docx VIP
- 人教版小学二年级上册体育教案(全册详案版).pdf VIP
- 2025新疆投资发展(集团)有限责任公司及所属公司招聘71人笔试模拟试题及答案解析.docx VIP
- Reflections on the determinants of voluntary turnover外文电子书籍.pdf VIP
文档评论(0)