《协方差及相关系数》.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
契比雪夫不等式 证明 取连续型随机变量的情况来证明. 切比雪夫不等式 得 切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。 从切比雪夫不等式还可以看出, 对于给定的? 0, 当方差越小时,事件{|X-E(X)|≥?}发生的概率也越小,即X的取值越集中在E(X)附近.这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量. 当D(X)已知时,切贝雪夫不等式给出了X与E(X)的偏差小于? 的概率的估计值. 切比雪夫不等式的用途: (1)证明大数定律;(2)估计事件的概率。 例1 已知正常男性成人血液中 ,每一毫升白细胞数平均是7300,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率 . 解:设每毫升白细胞数为X 依题意,E(X)=7300,D(X)=7002 所求为 P(5200 X 9400) P(5200 X 9400) = P(-2100 X-E(X) 2100) = P{ |X-E(X)| 2100} 由切比雪夫不等式 P{ |X-E(X)| 2100} 即估计每毫升白细胞数在5200~9400之间的概率不小于8/9 . 协方差及相关系数 前面我们学习了随机变量的数学期望和方差,对于多维随机变量,除了其数学期望和方差外,我们还要研究反映各分量之间关系的数字特征,其中最重要的,就是现在要讨论的 协方差和相关系数 1. 问题的提出 一、协方差与相关系数的概念及性质 在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系。 这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图。 儿子的身高 父亲的身高 问:父亲及其成年儿子身高存在怎样的关系呢? father son 类似的问题有: 1、吸烟和患肺癌有什么关系? 2、受教育程度和失业有什么关系? 3、高考入学分数和大学学习成绩有什么关系? …… ??? 协方差 定义 对两个随机向量(X,Y),若E(X-EX)(Y-EY)存在, 则称 cov(X,Y)=E(X-EX)(Y-EY) 为X和Y的协方差。 特别, 若X=Y,则 cov(X,X)=E(X-EX)2=D(X) 因此,方差是协方差的特例, 协方差刻画两个随机变量之间的“某种”关系. 可以证明 若(X,Y)服从二维正态分布,即 则 2. 定义 可见,若X与Y独立,则 4. 计算协方差的一个简单公式 Cov(X,Y)= 0 . Cov(X,Y)=E(XY)-E(X)E(Y) D(X+Y)= D(X)+D(Y)+2Cov(X,Y) 3 随机变量和的方差与协方差的关系 (5) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) (3) Cov(X,Y)=Cov(Y,X) (对称性) 5.简单性质 (4) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数 下面请大家利用上面所学的知识进行证明。 (1) Cov(X,X)=D(X) (2) Cov(X,c)=0 (c为常数) 协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX,Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是 Cov(X*,Y*)=k2Cov(X,Y) 为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化: 再来计算X*和Y*的协方差,这样就引进了相关系数的概念. 为随机变量X和Y的相关系数 (correlation coefficient). 1.定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称 在不致引起混淆时,记 为 . 二、相关系数 2. 相关系数的性质 注意 |ρXY| 的大小反映了X,Y之间线性关系的密切程度: ρXY=0时, X,Y之间无线性关系; |ρXY|=1时,X,Y之间具有线性关系. ρXY0,X,Y正相关 ρXY0,X,Y负相关 ρXY ≠0,X,Y相关 ρXY=0,X,Y不相关 (ρXY=1,X,Y完全正相关) (ρXY=-1,X,Y完全负相关) x y 0 完全正相关 Y=aX+b a0 x y 0 完全负相关

文档评论(0)

tangtianbao1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档