SAS讲义十课Spearman等相关分析.docVIP

SAS讲义十课Spearman等相关分析.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS讲义十课Spearman等相关分析

Spearman等级相关分析 秩相关的Spearman等级相关分析 前面介绍了使用非参数方法比较总体的位置或刻度参数,我们同样也可以用非参数方法比较两总体之间相关问题。秩相关(rank correlation)又称等级相关,它是一种分析和等级间是否相关的方法。适用于某些不能准确地测量指标值而只能以严重程度、名次先后、反映大小等定出的等级资料,也适用于某些不呈正态分布或难于判断分布的资料。 设和分别为和各自在变量X和变量Y中的秩,如果变量X与变量Y之间存在着正相关,那么X与Y应当是同时增加或减少,这种现象当然会反映在(,)相应的秩(,)上。反之,若(,)具有同步性,那么(,)的变化也具有同步性。因此 (30.1)具有较小的数值。如果变量X与变量Y之间存在着负相关,那么X与Y中一个增加时,另一个在减小,具有较大的数值。既然由(,)构成的样本相关系数反映了X与Y之间相关???否的信息,那么在参数相关系数的公式中以和分别代替和,不是同样地反映了这种信息吗?基于这种想法,Charles Spearman秩相关系数应运而生: (30.2)与形式上完全一致,但在中的秩,不管X与Y取值如何,总是只取1到之间的数值,因此它不涉及X与Y总体其他的内在性质,例如秩相关不需要总体具有有限两阶矩的要求。由于 因此公式(30.2)可以化简为 (30.3)显然在=时,秩相关系数到达最大值+1。又因为 而在每对+=时到达最小值,最小值求法为 所以最小的为 最大的为 故秩相关系数的最小值为1-2=-1。 在原假设和不相关的情况为真时,即秩相关系数为0时,的期望值为0,样本的方差为 (30.4)自由度为且分布关于零点对称。当10时,的样本分布可以标准化为近似的t分布 (30.5)例30.1某公司想要知道是否职工期望成为好的销售员而实际上就能有好的销售记录。为了调查这个问题,公司的副总裁仔细地查看和评价了公司10个职工的初始面试摘要、学科成绩、推荐信等材料,最后副总裁根据他们成功的潜能给出了单独的等级评分。二年后获得了实际的销售记录,得到了第二份等级评分,见表30.1中的第1到4列所示。统计问题为是否职工的销售潜能与开始二年的实际销售成绩一致。 表30.1 职工的销售潜能与销售成绩的秩相关分析 职工编号潜能等级销售成绩成绩等级124001112436031137300524412956-525562807-11633504-11710200100089260811982209-1110538523944Spearman秩相关系数的计算过程见表4.10中的第5到6列所示,最后计算结果为 表明潜能与成绩之间是较强的正相关,高的潜能趋向于好的成绩。秩相关系数原假设为0的t检验统计量为 查表自由度为8,t=3.05的双侧p=0.0158。在0.05显著水平上,t分布的上临界点为2.30,由于3.052.30,所以拒绝秩相关系数为0的原假设,接受潜能与成绩之间存在秩相关。 Corr相关过程 Corr相关过程用于计算变量之间的相关系数,包括Pearson(皮尔逊)的乘积矩相关和加权乘积矩相关。还能产生三个非参数的关联测量:Spearman的秩相关,Kendall的tau-b和Hoeffding的相关性度量D。该过程也可以计算偏相关等一些单变量的描述性统计量。 Corr过程说明 proc corr过程一般由下列语句控制: proc corr data=数据集 选项;var 变量列表;with 变量列表 ;partial 变量列表 ;weight 变量 ;freq 变量 ;By 变量列表 ;run ;proc corr语句调用corr过程,且是唯一必须的语句。如果只使用proc corr这一条的语句,过程计算输入数据集中所有数值变量之间的相关系数。其余语句是供选择的。 proc corr语句的选项 outp=数据集名——产生含有Pearson相关系数的一个新数据集。 outs=数据集名——产生含有Spearman等级相关系数的一个新数据集。 outk=数据集名——产生含有Kendallτb相关系数的一个新数据集。 outh=数据集名——产生含有Hoeffding D统计量的一个新数据集。 pearson——要求计算通常的pearson乘积矩相关系数,是缺省值。 hoeffding——要求计算并输出Hoeffding 的D统计量。 kendall——要求计算并输出Kendallτb相关系数。

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档