- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
如何判别
例2:例1基础上,已知破产企业所占的比例约为10%,即P1=0.1,P2=0.9。假定两类企业都符合正态分布,且方差相同。 企业: 由于 ,所以该企业被判为非破产企业。 Fisher判别(典型判别) 基本思想是投影(或降维): 用 的几个线性组合(称为典型变量) 代替原始的 p 个变量(r p) 根据 对样本的归属作出判别 二元变量(x1,x2)映射到一元变量(y) 判别函数构造 构造目标: 线性组合 能最大限度地表现出各组之间 的差异: (1) 来自两个不同总体的变量 y(1) 和 y(2) 的差异越大越好 即 的离差平方和 越小越好 (2)来自同一总体的各个样品之间的差异越小越好 称 为判别函数 距离度量(1) 1. 欧氏距离(Euclidean Distance) 2. 曼哈顿距离(Manhattan Distance) 3. 切比雪夫距离 ( Chebyshev Distance ) 4. 闵可夫斯基距离(Minkowski Distance) 5. 标准化欧氏距离(Standardized Euclidean distance ) 距离度量(2) 6. 马氏距离(Mahalanobis Distance) 7. 夹角余弦(Cosine) 8. 汉明距离(Hamming distance) 9. 杰卡德相似系数(Jaccard similarity coefficient) 10. 相关系数( Correlation coefficient )与相关距离(Correlation distance) 判别分析步骤 第1步:判别分析的对象 1) 确定在两个或者更多事先定义的组上的一组变量的平均得分剖面是否存在显著性差异。 2) 确定哪些变量在两个或更多组的平均得分剖面的差异中解释最多。 3) 在一组变量得分的基础上,建立将对象(个体、公司、产品等等)分类的步骤。 4) 建立由这组变量形成的组与组之间判别函数的数目及构成。 第2步:判别分析的研究设计 包括解释变量和被解释变量的选择、估计判别函数所需的样本量和为了验证目的对样本的分割。 第3步:判别分析的假定 推导判别函数的关键假定是解释变量的多元正态性和由被解释变量定义的各组的未知但相等的协方差结构。不满足多元正态性假定在估计判别方程时可能会出现问题。 第4步:估计判别模型和评估整体拟合 为了推导判别函数,研究者必须确定估计的方法,然后确定保留的函数个数。 第5步:结果的解释 解释判别函数传统的方法是观察计算判别函数时赋予每个变量的标准化判别权重(有时也称为判别系数)的符号和大小。 第6步:验证 验证判别分析的结果,通常采用分割样本或者交叉验证法。 附:协方差 协方差衡量两个随机变量之间的总体误差 方差是协方差的特例,即两个随机变量相同。 二维随机变量X与Y,E(X) = μ 与 E(Y) = ν,协方差: cov(X,Y) = E(XY) - E(X) E(Y) 1)X与Y的变化趋势一致,两个变量之间的协方差为正,表示X与Y正相关; 2)X与Y的变化趋势相反,两个变量之间的协方差为负,表示X与Y负相关; 3)X与Y是统计独立的, X与Y的协方差就是0。 表示X与Y之间的相关程度 附:协方差矩阵 设x = (x1 x2 … xn)为n维随机向量 1)定义其均值(期望)向量为 Ex = (Ex1 Ex2 … Exn) 2)定义其协方差矩阵为: D(x) = E{(x-Ex) (x-Ex)}= (vij)n×n , vij = cov(xi,?xj) 3)定义相关矩阵为 定义 与 的协方差阵为 cov(x,?y) = E[(x-Ex) (y-Ey)]= (vij)n×m 作业 收集合适的数据集,进行判别分析或聚类分析 数据集预处理 训练分类标准 选择不同参数,测试并画图说明分类的准确性。 撰写实验报告。 概率统计与随机过程 宋 晖 – 2013年秋 第五章 判别分析与聚类分析 判别分析 基本原理 距离定义 贝叶斯判别 费希尔判别(Fisher) 聚类分析 基本原理 距离定义 系统聚类法 应用实例 分析目标 将对象(
您可能关注的文档
- 墨西哥饮食特色文化.ppt
- 基于“情境体验”的高中写作教学策略与实践研究 - 萧山三中.doc
- 增分突破一立意增分练 [温馨提示] 作文立意就是确定文章的中心思想 .ppt
- 壳幔混合及花岗质岩浆的形成 - 矿物岩石地球化学通报.pdf
- 壹、 研究动机贰、 研究目的参、 研究设备及器材: 肆、 研究过程和方法.pdf
- 壳贱伤农、壳贵伤民与薄利多销的经济意义.ppt
- 塑造企业文化的意义和目的四 - 振东集团.ppt
- 壹、引言 - 淡江大学.pdf
- 复制剽窃造假.pdf
- 壁腹膜 - 长江大学.ppt
- 2025年抚州市血液中心事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年宜昌市红十字会系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年宜昌市疾病和预防控制中心人员招聘笔试备考试题及答案解析.docx
- 2025年抚州市应急管理系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年宜昌市劳动保障监查系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年镇江市红十字会系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年镇江市疾病和预防控制中心人员招聘笔试备考试题及答案解析.docx
- 2025年宜昌市市场监督管理系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年抚州市住房和城乡建设系统事业单位人员招聘笔试备考试题及答案解析.docx
- 2025年镇江市劳动保障监查系统事业单位人员招聘笔试备考试题及答案解析.docx
文档评论(0)