- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医药数据挖掘.
医药数据挖掘
Data mining in medicine
季海霞
山西省中医药研究院 ,030012 ,2533360723@
1简介 1
2过程 1
3常用算法 2
3.1 关联分析 3
3.2 分类分析 3
3.3 聚类分析 4
3.4 时间序列分析 4
3.5 决策树方法 4
3.6 神经元网络技术 4
3.7 粗糙集理论 5
4在中医药领域的应用情况 5
4.1 关联分析法 5
4.2 典型的分类分析 5
4.3 聚类方法 5
4.4 时间序列分析 6
4.5 决策树 6
4.6 神经网络 6
5结论与展望 6
6 参考文献 6
【中文摘要】数据挖掘是世纪末逐步形成的一个多种学科交叉的领域,至今已经普遍地应用在零售、医药、通讯、金融、航空、电子工程、旅馆等具有众多数据和需要数据深度分析的领域.本文从四个方面具体地介绍了数据挖掘的定义,过程,常见的数据挖掘算法和在中医药领域的应用情况。
【关键词】医药、数据挖掘、算法、应用
Data mining is a multi-disciplinary field gradually formed at end of the century, has been widely applied in the fields that have a number of data and need in-depth analysis of data including retail, pharmaceutical, telecommunications, finance, aviation, electronic engineering, hotels, etc. In this paper,from four specific aspects ,introduces definitions of data mining, process, common data mining algorithms and applications in the field of medicine.
【Key words 】medicine;data mining; algorithms; using
1简介
近来, 数据挖掘逐渐地引起了医药领域的极大关注, 其原因是医药数据的数量十分庞大, 且急需将这些数据快速而准确的转变成有用的医药知识和可以利用的信息, 从而可将获取的知识和信息广泛适宜的应用于各类医学应用实践中。并且数据挖掘作为数据库与人工智能交叉融合的高端信息处理技术,其在一定程度上可以帮助人们借助现代信息处理技术,获得隐藏在数据中反映事物的本质特点和预测事态发展趋向的有用知识,并且以这些知识为基础可以用来辅助科学决策。
数据挖掘必威体育精装版的描述性定义是由Usama M .Fayy yad 等[1] 给出的:数据挖掘即数据库中的知识发现、描述、统计、分析与利用[2],就是从大量的数据库中提取人们感兴趣的相关知识,这些知识是人们一开始未知的、隐藏的、密集的、模糊的、看起来似乎随机的信息,其表现为规则、概念、模式、规律等形式[3]。也是从数据集中识别出有效的、新颖的、有潜在价值的, 以及最终可被理解的模式的非平凡过程。数据挖掘是一个多种应用学科有机交叉形成的广泛的领域, 其包括知识库系统、人工智能、数据库技术、机器学习、信息检索、统计学、神经网络、模式识别、高性能计算、知识获取、和可视化等相关内容[4]。其任务大体上可分为描述和分析预测数据的进一步发展对事物的有效影响。
2过程
从医药技术的多重角度来看,数据挖掘的基本过程如下图1。
图1 数据挖掘的基本过程
并且在采集数据之后,抽样和清理之类的工作还需再进行。其清理的结果就是人们想要得到的数据样本集。此外数据仓库的数据应用形式[5]也是一种数据存储的有效形式,对数据挖掘应用方面极大的有利。然后,就可以应用各种算法来挖掘数据。但有的时候,还有需要返回到上一阶段的情况出现,重新将上述过程经历一遍或数遍。
数据挖掘的采用基本算法根据其挖掘方式的不同可以分为有教师型和无教师型两种形式,也就是所谓的监督学习和非监督学习。首先在有监督学习算法中,先会给与一个教师信号,对训练的样本集中的每个输入样本能获得分类代价和类别标记,并且寻找能够降低总成本价值的方向。其次在无监督学习算法中却没有显式的教师。
。
图2数据挖掘算法
关联分析即是从大量的数据中来发现不同项或项集之间隐含的联系或相互关联。如果两个或多个数据项之间的取值多次出现并且重复概率较高时,那它们之间就存在着某种关联,可以建立这些数据项之间的关联规则。通常有用的关联规则一般需要满足设定的支持度和置信度这两个条件,前者是一组
您可能关注的文档
- 医疗器械经营管理制度(符合GSP)..doc
- 医疗器械经营质量管理制度工作程序..doc
- 医疗器械经营质量管理规范现场检查指导原则20151015..docx
- 医疗器械经营验收..doc
- 医疗器械行业发展..docx
- 医疗器械风险管理危险源分析模板..doc
- 医疗废物处理试题及答案..doc
- 医疗急救知识800题(含答案)..doc
- 医疗技术临床管理办法..doc
- 医疗护理技能操作规范..doc
- 教科版(2017秋)科学二年级上册2.6 做一顶帽子 教学设计.docx
- 河北高频考点专训四 质量守恒定律的应用教学设计---2024-2025学年九年级化学人教版(2024)上册.docx
- 大单元教学【核心素养目标】6.3 24时计时法教学设计 人教版三年级下册.docx
- 河南省商城县李集中学2023-2024学年下学期九年级历史中考模拟八(讲评教学设计).docx
- 第18章 第25课时 正方形的性质2023-2024学年八年级下册数学课时分层作业教学设计( 人教版).docx
- Module 8 模块测试 教学设计 2024-2025学年英语外研版八年级上册.docx
- 2024-2025学年小学数学五年级下册浙教版教学设计合集.docx
- 2024-2025学年小学劳动四年级下册人民版《劳动》(2022)教学设计合集.docx
- 2024-2025学年小学数学三年级上册冀教版(2024)教学设计合集.docx
- 2024-2025学年高中生物学必修1《分子与细胞》人教版教学设计合集.docx
文档评论(0)