- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
谢谢!欢迎多提宝贵意见! 第三十页,共三十一页。 内容总结 基于语义网格的语义关联存储模型及管理和通信平台。基于语义网技术的数据存储趋势( OntoWeb )。对RDF/S支持远多于对标准本体语(DAML+OIL)的支持。人工定义本体开销非常大,要求能自动或人工辅助半自动定义本体。运用机器学习、数据挖掘等技术创建新本体, 使本体具有自学习功能。合并核心本体并形成上层本体。信息从无结构到有结构。实体以及实体间联系的自动识别。资源分类结合知识管理、数据挖掘、机器学习以及信息检索等方面技术。对网格数据提取语义特征向量,运用数据挖掘、信息检索中潜在语义索引(LSI) 等技术。根据语义特征向量对数据进行基于本体的分类,结合kNN、支持向量机、贝叶斯概率等分类方法。欢迎多提宝贵意见 第三十一页,共三十一页。 合同预期目标 1.基于概念和语义逻辑解决语义关联的存储模型问题,为建立良好的语义储存管理机制提供理论基础。 2.分析和推导基于主动存储的语义网格计算理论,为基于主动存储的语义网格计算模型的建立提供理论基础。 3.建立基于主动存储的语义网格计算模型,为存储资源的自主检测和自主控制提供支持,实现语义网格的主动存储。 HMM:隐马尔可夫模型 SVM:space vector model 说明: 信息抽取的特异性:不同的系统要求不同 用户通过基于本体的语义检索知识库得到知识; 来自网上的各种无结构、半结构的文档在分析自动或半自动提取出本领域的本体知识后,利用信息抽取工具, 提取出知识,并分散存储在各个知识库中; 上图右边主要是人工和自动结合生成本体,如可以先人工确定一些主要本体,然后采用机器学习生成新的本体,同时可以编辑自动生成的本体。 概念之间相似度 [Yuhua Li, et al TKDE’03] 用户数据访问行为的相似度 [data-sharing graph Infocom’04 Adriana Iamnitichi, Matei Ripeanu, Ian Foster et al] 关键字和文档之间的相似度[Google PageRank] 参考 [1]. Yuhua Li, Zuhair A. Bandar, and David Mclean, “An Approach for Measuring Semantic Similarity between Words Using Multiple Informaiton Sources”, IEEE Transaction on Knowledge and Data Engineering, Vol. 15, No. 4, July/August, 2003. 这篇文章主要论述了度量概念之间的语义相似度问题. [2]. Adriana Iamnitchi, Matei Ripeanu, and Ian foster, “Small-World File-Sharing Communities”, Infocom’ 2004 这篇文章提出了 data-sharing graph的概念,用于揭示了网格,p2p和Web环境下,用户的数据使用行为,用于指导数据的分布和网络环境下存储结构的设计. 文章实验通过分析了以下三个实际使用系统的trace数据, a.”the Dzero Experiment”高能物理合作实验 b.Kazaa对等网络 c.Boeing proxing的trace数据 Ian Forster等人分析了三个文件共享系统中的用户行为, 发现了自组织结构在数据存储结构中具有重要的研究价值. 我们这个研究内容的主要成果是给出了基于同构本体的网格存储结点之间相似度的量化度量方法. 网格存储结点基于相同的概念模型(可以使平面, 层次,甚至可以是类似词典一样的网状概念结构). (PPT中以层次结构为例子).一个结点上存储的数据是概念空间的某个子集合,通过统计存储结点上概念子集中每个概念出现的 频率对一个结点的语义信息进行量化描述. 最后将网格存储结点之间的语义相似度量化为带权概念 集合之间的相似度. 在SemreX的研究中,我们根据网格结点的相似行在数据网格结构基础上构造了一个逻辑上的上层语义存储结构. 结点按照他们的语义相似度形成自组织存储网络. 网格环境下的语义查询是一种复杂和困难的过程.首先,要提高系统的查准率, 我们用语义来规范查询语句, 避免二义性, 另一方面要在降低查询负载的情况下提高网格环境下信息的查全率. 我们的策略是在网格语义拓扑中向语义相似性度高的网格结点转发查询请求, 在相似度高的结点上执行最终的语义查询.我们对查询算法进行了仿真测试, 将我们的语义路由算法和传统的广播算法进行了比较, 我们的方法在提高语义查全率的同时大幅降低了查询负载. 这页pp
文档评论(0)