相关系数及其应用解析.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关系数及其应用 摘要:在自然界、工农业生产一级科学试验研究中,许多事物或现象彼此之间存在相互依赖、相互制约的依存关系,这些依存关系,有的十分密切,有的不很密切。为了研究这个依存关系,我们用变量来解释,对于变量之间的不确定关系,我们称为相关关系,其密切程度用相关系数刻画。 关键词:相关关系;相关系数;随机变量;线性关系。 相关系数的介绍 相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。 依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。 相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。 简单相关系数:又叫相关系数或线性相关系数,一般用字母P 表示,用来度量两个变量间的线性关系。 复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。 典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。 定理:的充要条件是,存在常数,使得 ; 相关系数取值在到之间,时,称不相关;时,称完全相关,此时,之间具有线性函数关系;时,的变动引起的部分变动,越大,的变动引起的变动就越大, 时称为高度相关,当时称为低度相关,其它时候为中度相关。 推论:若,则有 证明: 令则, , 若则若,则。 相关系数的公式如下:                 1.4相关系数的意义: 为了分析方便,我们定义两个变量,即自变量和因变量,因变量随着自变量的变化而变化(但实际上与之间并无因果之分,即自变量与因变量区分)。变量之间的相关关系按自变量与因变量的相关关系方向可分为正相关和负相关。所谓正相关,即一个变量增大时,另一个变量的值随之增大;变量减少时,另一变量亦随之减少;两个变量同方向变化。若自变量的值增大时,而因变量的值随之减少;自变量的值减少时,而因变量的值增大;自变量与因变量反方向变化,这种相关关系称为负相关。对两个变量进行相关分析,第一步是收集大量的相对应数据,绘制自变量与因变量相对应观察点的散点图,根据散点图判断相关关系密切与否;第二步,判别与为直线相关还是曲线相关。如果这些观察点的分布集中于一条带子上,就可初步判断为相关关系密切;如果观察点很分散,无集中趋势或趋势不明显,就可认为相关关系不密切。第三步,初步认为关系密切时,再进一步进行分析。如果点分布在一条直线上,即可判定为直线相关;如果分布在一条曲线上,即判定为曲线相关。 若通过、散点图观察,认为变量间的相关关系比较密切,并为直线相关时,就可计算其相关系数,以准确地分析其相关关系的密切程度。 相关系数是用来刻画、之间的线性关系的密切程度,用表示。根据值得大小,即可评价两个变量的密切相关程度。若时,说明与完全线性相关,散点图上,所有点均在一条直线上;,表明与间无线性关系,或无任何关系,或可能为曲线关系,散点图上的点呈现出无规则的一团或呈曲线;,是相关关系的一般情形,当较大时,表明与之间线性关系密切,散点图上的诸点紧密的靠近一条直线;当很小时,表明与相关关系不密切;,称正相关;,称负相关。 两个随机变量与之间的线性关系的密切程度用相关系数来刻画。我们对组观察点进行分析,计算相关系数。通过相关系数的分析,判定事物之间的内在关系。 2.相关系数的应用: 2.1在概率论计算中的应用 例1.若将一枚硬币抛次,表示次试验中出现正面的次数,表示次试验中出现反面的次数。计算。 解:由于,则,根据相关系数的性质推论,得。 例2.已知随机变量分别服从正态分布且的相关系数设,求证相互独立。 证明:由已知得 由于正态分布的随机变量的线性组合仍然服从正态分布,知。 , , , 又, , , , 不相关。 由于正态随机变量的相互独立与互不相关等价,故相互独立。 相关系数的缺点 相关系数有一个明显的缺点,它接近于的程度与数据组数相关,容易给人一种假象。因为,当较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于;当较大时,相关系数的绝对值容易偏小。特别是当时,相关系数的绝对值总为。因此

文档评论(0)

三哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档