生物医学文本挖掘研究的体会中国中医科学院中医药信息研究所.pptxVIP

生物医学文本挖掘研究的体会中国中医科学院中医药信息研究所.pptx

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1页/共56页生物医学文本挖掘研究的体会中国中医科学院中医药信息研究所第2页/共56页主要内容开展的课题 “运用文本数据库中元数据关联规则进行知识发现的研究”文本挖掘工具课题申请的体会第3页/共56页运用文本数据库中元数据关联规则进行知识发现的研究文本数据库:PubMed元数据:关于数据的数据 ,MeSH主题词关联规则:association rule,在同一个事件中出现的不同项的相关性,如在一次购物活动中所购商品的相关性(尿布→啤酒:30%~40%)事件:一篇论文;不同项:MeSH主题词MeSH主题词在同一篇文章中出现有规律吗?可否利用这种关联规律来发现知识? 第4页/共56页背景知识知识发现(KDD):从数据中正规提取隐含的、以前未知的并且可能有用的知识。数据挖掘:在数据中正规地发现有效的、新颖的、潜在有用的、并且最终可以被读懂的模式的过程。一般可以把数据挖掘当作知识发现的一个具体步骤。 第5页/共56页背景知识第6页/共56页文本挖掘Text Mining:文本挖掘Literature Based Discovery (LBD):基于文献的发现Knowledge Discovery in Biomedical Literature (KDiBL):生物医学文献知识发现 第7页/共56页第8页/共56页第9页/共56页背景知识Cimino的研究哥伦比亚大学。如果在一篇文献纪录中同时存在“疾病类主题词/化学诱导副主题词”和“药物类主题词/副作用副主题词”这样的组合的话,那么可以建议该疾病由该化学物质(药物)引起。 If Disease/chemically induced AND Chemical/adverse effects Then Diseaseis Caused by Chemical.形成规则。将这样的规则运用的具体的其他文献集合中,就会发现文献中报道了大量的具体疾病是由某一种具体药物引起的。形成关系。第10页/共56页背景知识规则的文字形式:“如果某一文献记录中含有属于1类的主题词A并且和副主题词X在一起,AND该引文还包括属于2类的主题词B并且和副主题词Y在一起,那么 建议A和B通过关系Z相关(A和B有Z关系)。” 根据Medline主题词和副主题词在同一篇文献中出现的情况,建立起主题词和副主题词之间的关联规则,然后将这些规则返回到具体的文献中形成了具体概念之间的关系。第11页/共56页本课题目标寻找发现规则的方法。将获得规则用于某一领域,得到具体的关系。运用具体的关系开发出专题的知识库。第12页/共56页技术路线下载专题文献截取高频M/S共词聚类分析高频M/S组合形成待检规则返回具体文献专家评价形成规则得到关系发现新知识Swanson模式得不到关系开发知识库第13页/共56页分析样本:下载文献三个层次微观层次:各个大类下的10个末级主题词 中观层次:针对每一种副主题词进行检索 宏观层次 :直接以大类名为检索策略 第14页/共56页/dan/medkit/第15页/共56页第16页/共56页第17页/共56页第18页/共56页关键点确定高频主题词截取阈值,共词聚类分析最佳分组数目,伪F检验。候选规则检验。规则是否成立。规则是否可靠?专家评分,敏感度等。不成立组合的分析:swanson模式,关系?知识库开发。第19页/共56页取得的成果方法是可行的。得到的规则。开发出相应的数据挖掘平台。BICOMSMeSH_Manager建立各种专题、主题的知识库。第20页/共56页规则样例M1S1M2S2M1/S1SRM2/S2A02PathologyG06null的病态结构作为… 的结果代谢过程A02PhysiologyG11Physiology的生理功能是...的位置的生理变化A02PhysiopathologyG11Physiology的异常功能破坏的生理变化A02MetabolismG04Physiology的代谢变化是...的位置的生理变化A02MetabolismD09Metabolism的代谢变化是...的位置的分解代谢A03Drug EffectsG06Drug Effects受药物作用发生了受药物作用A05Drug EffectsA05Metabolism受药物作用影响的代谢变化A07MetabolismD27Pharmacology的代谢变化受...影响的药理作用A07Drug EffectsG09Drug Effects受药物作用发生了受药物作用A07Drug EffectsA07Physiology受药物作用影响的生理功能A08Drug EffectsG05Drug Effects受药物作用发生了受药物作用第21页/共56页今后的方向应用领域上,向生物信息学靠拢;实行中,寻求获得经济效益的可能

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档