- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚 类 分 析 聚类分析:对于总体分类未知的一群事物依照“物以类聚”思想,把性质相近的事物归入同一类,而把性质相差较大的事物归入不同类的一种统计分析方法。 聚类分析可以分为两种类型:一种是对样品聚类,另一种是对指标聚类。 一、? 常用统计量 1. 聚类分析的数据格式 2. 聚类分析的常用统计量 (1) 距离系数d:第i个样品与第k个样品在P维 空间中的距离为: dik= (i,k=1,2,...,n) 其中dii=0,dik=dki 根据dik的大小,可以对n个样品进行聚类,即把两两之间距离小的样品归入同一类,距离大的样品归入不同的类。 消除变量量纲对距离系数的影响 ① 标准正态差变换: ② 极差变换: (2) 相关系数rik / P , / P 当r ik 的绝对值越接近1时,表明第i个样品与第k个样品的相似程度越大,此时,便越有理由将它们归入同一类;反之,应将两个样品归入不同的类。 相关系数多用于指标之间的聚类。 二、聚类方法 1.系统聚类法 系统聚类(systematic clucstering)法的基本思想是:先将n个样品各自看成一类。然后选择相似程度最大(距离系数dik最小或相关系数rik最大)的样品对归为一类;再选择相似程度次大的样品对归为一类。依次类推,直到所有的没有归入其他类的样品对都归类完为止。在进行归类过程中: ① 若两样品在已经形成的类中没有出现过,则成立一 个新类; ② 若两样品中有一个是在已经形成的类中出现过,则 另一样品加入该类; ③ 若两样品分别出现在已经形成的两个类中,则把这 两类归并为一大类; ④若两样品都在同一类中出现,则这一对样品就不再 归类了。 这样反复进行直到对所有样品都归类完毕为止,形成一个分类系统。 聚类结果树图: 2.逐步聚类法 ? 3.有序样品的聚类:最优分割法 判 别 分 析 判别分析:是对于总体分类已知的一群事物,根据已有的分类信息把性质相近的事物归入同一类,而把性质相差较大的事物归入不同类的一种统计分析方法。 判别分析可分为二类判别、多类判别、逐步判别和典则判别分析。 1.基本思想 同类内的样品其性质特征相似,表现在类内的离散程度应最小;不同类的样品其性质特征差异大,表现在类间的离散程度应最大,并以此为原则建立判别分类函数---Fisher判别准则。 2.二类判别分析的原理 设要判别的是两类,二类判别函数为: Y= 式中?j是待定参数,称为判别系数;Y是对样品进 行归类判别时的综合指标。 用y(1)作为第一类综合指标的代表,用y(2)作为第二类综合指标的代表。则两类之间的离散程度可用[y(1)-y(2)]2表示 第g类内部的离散程度可用 表示; 总的类内离散程度即为 。 令 I= ? 依据Fisher准则,?j的值应是下列方程组的解: =0 (j=1,2,…,P) 3. 确定判别的临界值 若假定,当有一个新样品需要进行判别归类时,把它的P个观测指标的取值代入判别函数计算Y值。如果Y Yc,就把它归入第一类;如果Y Yc,则把它归入第二类。 3. 判别效果的显著性检验 回代法:即利用所建立的判别函数式,对已知类别的所有样品重新进行判别归类。如果回代分类与实际分类的符合程度很高,则表明判别函数效果好;否则,表明判别效果不好。判别符合率的计算公式为: 判别符合率(%)=[符合样品数 /( n(1) +n(2) )]×100% 二、Bayes准则下的多类判别分析 ? 分类数2,称为多类判别分析 其基本思想是:对于一个待归类的新样品,计算它归属于已知各类的概率,最后把这个新样品判归概
文档评论(0)