- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 医学统计学 * 2.在方法上 判别分析:用已知个体类别(训练样本)的指标建立判别方程,对新的个体分类。要求数据服从正态,同时可筛选变量和指出变量重要性。 聚类分析:对未知类别个体,通过m个指标的接近程度(相似系数)做归类。不能筛选变量和指出变量的重要性。 * 医学统计学 * 3.在资料的设计和收集上: 判别分析:要事先已知个体类别或结果(y=1或0),收集 个体的m个指标(x)建立分类模型。 聚类分析:不需要个体的结果(y),只收集与分类有关的m个指标(x)。 * 医学统计学 * 选择题 例:有人测量了100名17岁男孩的8个形态指标:如身高、体重、胸围、大腿围、小腿长等,希望从形态学上了解8个指标的类别,可以用___方法. 统计方法: 1.判别分析 2.聚类(样品) 3.聚类(指标) 4.多元线性回归 5.logistic回归 6.析因分析 * 医学统计学 * 思考题 你认为: 聚类分析与判别分析有何不同? 判别分析与logistics回归有何不同? logistics回归与cox回归、多元线性回归有何不同? * 医学统计学 * 本次教学结束 孟虹 电话: 250-74479(办) 办公地点: 军事医学楼 415房间 谢谢! * 医学统计学 * 讲义表19-3 27名焦炉工的生物标志物检测指标数据(SPSS软件操作) * 医学统计学 * 系统聚类菜单 统计方法菜单 对样品聚类 * 医学统计学 * 表19-3数据 变量的统计描述 应对变量进行标准化,选用z分 * 医学统计学 * SPSS软件系统聚类 plots菜单框 method菜单框 选择欧氏距离和类平均法 标准化 * 医学统计学 * SPSS软件提供聚类方法 Cluster method: Between-groups linkage,类平均法(d2/n) Ward method. 最小方差法 Nearest neighbor,最短距离法(最小相似) Furthest neighbor,最长距离法(最大相似) Median clustering,中间距离法 Centroid clustering, 重心法 * 医学统计学 * 讲义27名焦炉工的生物标志物类平均法聚类图 欧氏距离 * 医学统计学 * 27名焦炉工的生物标志物最小相似系数法聚类图 欧氏距离 * 医学统计学 * 例2 研究目的:通过5指数对13个市进行分类,2005 年江苏省13 个城市社会发展指数 * 医学统计学 * 对13个市进行分类的聚类图 * 医学统计学 * 图1 结果的解释 一类:是无锡、苏州、南京、常州; 属于经济发达苏南, 区域优势明显,社会发展水平较高。 二类:扬州、镇江、南通、泰州的苏中地区, 为经济发展处于一般水平。 三类:徐州、淮安、盐城、连云港、宿迁是一类,社会经济发展低水平城市之列苏北地区。 结论:促进苏南苏中苏北三大区域协调发展。 * 医学统计学 * 例3不同产地黄芪微量元素的聚类分析 * 医学统计学 * 不同产地黄芪的微量元素 * 医学统计学 * 不同产地黄芪微量元素的聚类分析 * 医学统计学 * 系统聚类方法在应用时注意问题 方法和结果: 1) 用不同聚类方法,聚类结果(树状图)不同,一般计算多个方法尝试。 2)结合专业和聚类图得到归类结果。 3)主要用于样品(变量)较少的研究. * 医学统计学 * 第三节 动态样品聚类 (k-means cluster) 也称为快速聚类。 目前应用: 1.用于数量较大的样品聚类. 2.数据挖掘分析 生物信息技术的基因芯片功能研究 * 医学统计学 * 计算步骤 1.事先人为指定分类数(k类). 2.根据数据本身的结构确定k类的原始中心点(mean). 3.采用欧氏距离将样品自动归为距离最近(均数)的类。计算新的中心点(mean). 4.根据新中心点(mean),计算各样品的距离. 5.重复3-4步.达到规定要求结束. * 医学统计学 * 动态样品聚类的原理 选k个凝聚点 初始分类 分类是否合理 最终分类 修改分类 是 否 * 医学统计学 * 动态样品聚类特点 优点: 用于数量较大的样品聚类.
您可能关注的文档
最近下载
- 太阳能光伏板安装合同协议.docx VIP
- 智融SW6306V_数据手册.pdf VIP
- 全国第三届职业技能大赛(全媒体运营项目)选拔赛理论考试题库资料(含答案).pdf VIP
- 2018年高职教育专业教学资源库建设方案-深圳职业技术学院评审.docx VIP
- 职业技术学院专业教学资源库建设与管理实施办法(试行).docx VIP
- 教育部中小学德育工作指南.pptx VIP
- 2025年成人高考时事政治试卷及答案.docx VIP
- 《工程渣土资源化利用技术规程》DB32T 5172-2025(江苏省标).pdf VIP
- 建筑结构抗震设计第三章振型分解反应谱法.ppt VIP
- 《走近周杰伦》课件.ppt VIP
文档评论(0)