利用SPSS进行主成分分析.docVIP

下载本文档

11
0
约5.1千字
约 15页
2024-03-31 发布于江苏
举报
版权申诉

利用SPSS进行主成分分析.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

利用SPSS进行主成分分析

PAGE

PAGE8

利用SPSS进行主成分分析

以全国31个省市的8项经济指标为例，进行主成分分析。

第一步：录入或调入数据（图1）。

图1原始数据（未经标准化）

第二步：打开“因子分析”对话框。

沿着主菜单的“Analyze→DataReduction→Factor”的路径（图2）打开因子分析选项框（图3）。

图2打开因子分析对话框的路径

图3因子分析选项框

第三步：选项设置。

首先，在源变量框中选中需要进行分析的变量，点击右边的箭头符号，将需要的变量调入变量（Variables）栏中（图3）。在本例中，全部8个变量都要用上，故全部调入（图4）。因无特殊需要，故不必理会“Value”栏。下面逐项设置。

图4将变量移到变量栏以后

=1\*GB1⒈设置Descriptives选项。

单击Descriptives按钮（图4），弹出Descriptives对话框（图5）。

主成分分析中，主成分得分的方差就是对应的特征根数值。如果默认，则所有方差大于等于1的主成分将被保留，其余舍弃。如果觉得最后选取的主成分数量不足，可以将值降低，例如取；如果认为最后的提取的主成分数量偏多，则可以提高值，例如取。主成分数目是否合适，要在进行一轮分析以后才能肯定。因此，特征根数值的设定，要在反复试验以后才能决定。一般而言，在初次分析时，最好降低特征根的临界值（如取），这样提取的主成分将会偏多，根据初次分析的结果，在第二轮分析过程中可以调整特征根的大小。

第二种方法是直接指定主成分的数目即因子数目，这要选中Numberoffactors复选项。主成分的数目选多少合适？开始我们并不十分清楚。因此，首次不妨将数值设大一些，但不能超过变量数目。本例有8个变量，因此，最大的主成分提取数目为8，不得超过此数。在我们第一轮分析中，采用系统默认的方法提取主成分。

图6提取对话框

需要注意的是：主成分计算是利用迭代（Iterations）方法，系统默认的迭代次数是25次。但是，当数据量较大时，25次迭代是不够的，需要改为50次、100次乃至更多。对于本例而言，变量较少，25次迭代足够，故无需改动。

设置完成以后，单击Continue按钮完成设置（图6）。

=3\*GB1⒊设置Scores设置。

选中Saveasvariables栏，则分析结果中给出标准化的主成分得分（在数据表的后面）。至于方法复选项，对主成分分析而言，三种方法没有分别，采用系统默认的“回归”（Regression）法即可。

图7因子得分对话框

选中Displayfactorscorecoefficientmatrix，则在分析结果中给出因子得分系数矩阵及其相关矩阵。

设置完成以后，单击Continue按钮完成设置（图7）。

=4\*GB1⒋其它。

对于主成分分析而言，旋转项（Rotation）可以不必设置；对于数据没有缺失的情况下，Option项可以不必理会。

全部设置完成以后，点击OK确定，SPSS很快给出计算结果（图8）。

图8主成分分析的结果

第四步，结果解读。

在因子分析结果（Output）中，首先给出的DescriptiveStatistics，第一列Mean对应的变量的算术平均值，计算公式为

第二列Std.Deviation对应的是样本标准差，计算公式为

第三列AnalysisN对应是样本数目。这一组数据在分析过程中可作参考。

接下来是CorrelationMatrix(相关系数矩阵)，一般而言，相关系数高的变量，大多会进入同一个主成分，但不尽然，除了相关系数外，决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值，毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值，根据关系式可知，det(λI)=det(R),从而Determinant=1.133E-0.4=λ1*λ2*λ3*λ4*λ5*λ6*λ7*λ8。这一点在后面将会得到验证。

在Communalities(公因子方差)中，给出了因子载荷阵的初始公因子方差（Initial）和提取公因子方差（Extraction），后面将会看到它们的含义。

在TotalVarianceExplained(全部解