- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析课程设计报告样例女性空腹及摄入食糖后体内血糖含量主成分分析
目 录 目 录 I 一、问题分析 1 1.1 问题重述 1 1.2 问题分析 1 二、主成分分析方法基本原理 2 2.1 主成分分析基本思想 2 2.2 主成分分析的数学模型 2 2.3 主成分分析的计算步骤 3 三、问题求解 5 四、结果分析 7 4.1 相关系数矩阵 7 4.2 协方差阵 8 五、总 结 9 六、课程设计心得体会 9 参考文献 10 一、问题分析 1.1 问题重述 49位女性在空腹情况下三个不同时刻的血糖含量(用表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小表示)的观测值(单位:mg/100ml). 问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于S和R的分析那个结果更为合理? 1.2 问题分析 我们根据主成分分析的基本思想,设法将原来众多的具有一定相关性的指标个指标作线性组合,作为新的综合指标。 然后,在所有的线性组合中分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,计算出各个主成分,进而代表原来个指标的信息。 进一步,建立主成分分析的数学模型。 最后利用sas统计软件来求解出各个主成分和各主成分的贡献率。 二、主成分分析方法基本原理 2.1 主成分分析基本思想 主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标(比如个指标作线性组合,作为新的综合指标。但是这种线性组合,如果不加限制,则可以有很多,应该如何去选取呢? 在所有的线性组合中所选取的应该是方差最大的,故称为第一主成分。如果第一主成分不足以代表原来个指标的信息,再考虑选取即选第二个线性组合。为了有效地反映原有信息,已有的信息就不需要再出现在中,用数学语言表达就是要求。称为第二主成分,依此类推可以构造出第三、第四、…、第个主成分。 2.2 主成分分析的数学模型 设有项指标(变量):,得到原始数据资料阵: 其中. 用数据矩阵的个列向量(即个指标向量)作线性组合,得综合指标向量: 简写成: 为了加以限制,对组合系数作如下要求: 即:为单位向量:,且由下列原则决定: 1) 与互不相关,即,其中是的协方差阵。 2) 是的一切线性组合(系数满足上述要求)中方差最大的,即: ,其中 是与不相关的一切线性组合中方差最大的,是与,都不相关的的一切线性组合中方差最大的。 满足上述要求的综合指标向量就是主成分,这个主成分从原始指标所提供的信息总量中所提取的信息量依次递减,每一个主成分所提取的信息量用方差来度量,主成分方差的贡献就等于原指标相关系数矩阵相应的特征值,每一个主成分的组合系数: 就是相应特征值所对应的单位特征向量。方差的贡献率为 其中,越大,说明相应的主成分反映综合信息的能力越强。 2.3 主成分分析的计算步骤 (1) 计算协方差矩阵 计算样品数据的协方差矩阵: 其中, (2) 求出的特征值及相应的特征向量 求出协方差矩阵的特征值及相应的正交化单位特征向量: 则的第个主成分为 (3) 选择主成分 在已确定的全部个主成分中合理选择个来实现最终的评价分析。一般用方差贡献率 解释主成分所反映的信息量的大小,的确定以累计贡献率 达到足够大(一般在85%以上)为原则。 (4) 计算主成分得分 计算个样品在个主成分上的得分: (5) 标准化 实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的影响。消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换: 其中, , , 标准化后的数据阵记为,其中每个列向量(标准化变量)的均值为0, 标准差为1,数据无量纲。 标准化后变量的协方差矩阵(Covariance Matrix),即原变量的相关系数矩阵(Correlation Matrix) 此时个样品在个主成分上的得分应为: 三、问题求解 1. 使用“分析家”做主成分分析的步骤 1) 在“分析家”中打开数据集Mylib.xydj; 2) 选择菜单“Statistics(统计)”(“Multivariate(多元分析)”(“Principal Components(主成分分析)”,打开“Principal Components”对话框; 3) 在对话框中输入主成分分析的变量,如图所示。 图6-1 多元分析对话框
您可能关注的文档
最近下载
- 2022年ECR ECN基础知识ppt课件.pptx VIP
- 2025年实验动物从业人员上岗证试题库+答案.docx
- 庄周梦蝶原文课件.pptx VIP
- 卧式储罐安装施工方案.docx VIP
- 二零二五版特种电缆定制与研发合作合同.docx
- 生长发育迟缓的诊断与干预.docx VIP
- 佳能 iC MF645Cx 645 彩色激光打印机中文维修手册.pdf VIP
- T_ZGCMITT 006.2-2022 介入诊疗服务质量评价 第2部分:介入诊疗技术规范.docx VIP
- SL 285-2020 水利水电工程进水口设计规范.pdf
- 2025年广州市花都区人民医院医护人员招聘备考试题及答案解析.docx VIP
文档评论(0)