1、Swanson方法概述.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、Swanson方法概述

1、Swanson方法概述   非相关文献指表面上没有联系,即不存在互引、共引或其他相关文献条件(比如相同的作者项等),却可能存在着某种能引致新知识产生的具有潜在关联关系的两组文献。华盛顿大学的Don. R. Swanson教授提出的文献知识发现理论就是基于非相关的生物医学文献中可能隐含着大量的不为人知的科学知识这一假设。Swanson认为,对于两组非相关文献A和C,可以通过某中间词或中间文献B建立起二者的关联,上述发现A、C关联的过程称为非相关文献知识发现方法[1],本文称为Swanson方法。   研究人员的直觉、经验和知识以及跨学科研究的能力都是该方法产生的因素,就如同青霉素的发现并最终引领抗生素的发展[2]。早期的Swanson方法主要应用于生物医学领域,并以PubMed作为主要数据源开展实证研究。很多学者在其基础上进行了方法的改进和应用领域的拓展,使得该方法在其他学科的移植应用成为可能。现已涉及生物、医学、文学、航天以及网络等多个领域,而且对Swanson方法的改进研究已不仅仅局限于PubMed数据库,扩展到可用于Biosis,Embase、Scisearch、Internet databases等数据库。   2、Swanson方法知识发现过程的研究框架   现有Swanson方法的研究主要有三个方面:对Swanson方法知识发现过程的分析;模拟开放式和闭合式知识发现过程进行领域应用或者对已有研究进行验证工作;对Swanson方法的改进研究,包括相关技术和算法的改进研究。其研究框架见图1。   图1Swanson方法研究框架   2.1Swanson方法的知识发现过程研究   Swanson方法的知识发现过程可分为两个步骤:形成假设和检验假设。形成假设的过程称为开放式的知识发现方法,而检验假设的过程是闭合式的知识发现方法[1]。   开放式的知识发现过程始于某一类型主题A,比如一种疾病、一种药用物质或一种基因,通过中间主题集合或文献集合B最终发现目标主题C,C主题对A主题产生一定的关联和影响。开放的形成假设的过程可能为疾病寻找一种新的治疗方法,例如Swanson发现鱼油对雷诺氏病的关联作用以及后来Padmini Srinivasan(2004)发现的姜黄素对视网膜疾病、克罗恩病和紊乱三种疾病有一定的作用[1]。开放式知识发现过程的路径为A→B→C。   闭合的知识发现方法是检验假设的过程。如果科研人员已经通过上述开放式知识发现方法形成了假设,他可以以文献为基础来详细地论证他的假设。以A和C为出发点,研究人员要努力寻找共同的关联词B。A和C的联系越多,所做的假设越有价值。闭合的知识发现过程可表示为A→B←C。   2.2基于Swanson方法的模拟应用研究   自Swanson提出基于文献的知识发现过程并应用该方法发现鱼油在治疗雷诺氏病方面的作用后,Swanson还利用该过程发现了可以作为生物武器的病毒[1]。Weeber利用该方法提出了thalidomide的治疗作用[3]。Chaussabel等发现基因之间的功能联系。冷伏海等(2008)在总结Swanson方法原理、流程分析基础上,模拟开放式知识发现过程,发现目标词plasma(等离子)和semiconductor(半导体)通过中间词electromagnetic wave absorption(吸收电磁波的特性)建立起与来源词stealth material(隐身材料)之间的联系,进而通过闭合式知识发现过程对该结论进行了文献验证[4]。Padmini(2004)利用开放式和闭合式知识发现过程发现并验证了姜黄素对视网膜疾病、紊乱和克罗恩疾病的治疗作用[2]。Hur J等(2010)利用该方法对糖尿病的致病基因进行了发现和验证[5]。   2.3基于Swanson方法的技术改进研究   基于Swanson方法的改进研究主要包括基于开放式和闭合式知识发现过程的文本挖掘算法,基于MeSH等主题词、短语、概念的来源主题词和目标主题词的改进分析以及跨领域和多数据源的应用研究等方面。   2.3.1基于主题词分析法的模拟研究鉴于主题词表的规范性,主题词作为分析单元可增加分析的准确度,又可以减少分析文献自由词所引起的噪声,技术上容易实现。郝丽云在其模拟研究中就是用了主题词分析法,在研究中下载MeSH字段对来源文献主题词进行处理,去掉文献中的副主题词,提取主题词,形成来源主题词集合A。分析的统计量包括:频次(f)、频次百分比(f%)、文献频次(df)和文献频次百分比(df%),将来源主题词A按f进行排序,形成初始中间集合B[6]。   2.3.2基于UMLS的改进研究中国医科大学的张晗等采用自然语言处理技术,将不规范的自然语言转换为UMLS中的

文档评论(0)

jixujianchi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档