- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 双变量回归与相关(简化版,正式)PPT
* e 0 * 0 0 0 0 e e e e 离群值 缺乏二次项 方差不齐 不独立 * P值越小越有理由认为变量间直线关系 存在,不能说关系越密切。 直线回归关系可以内插,不宜外延。 当样本含量较大时,统计学检验的作用 减弱。r0.05/2,100=0.195 4.结果的解释及正确应用 * 第三节 秩相关 Rank Correlation 一、Spearman 秩相关 * 应用条件: 1.不服从双变量正态分布而不宜作积差 相关分析; 2.总体分布类型未知; 3.原始数据用等级表示。 * (2)计算检验统计量 t 值 (1)建立检验假设并确定检验水准 (3)确定P值下结论 * (二)总体回归系数?的可信区间 此区间不包括β=0,结论为b有统计学意义。 * (三)利用回归方程进行估计与预测 1.总体均数 的可信区间 : 给定X后对应Y的总体均数 给定X后对应Y的样本均数 * 2.个体Y值的容许区间 给定X后对应个体Y值波动范围 * X Y (体重,kg) (体表面积,103cm2 ) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411 例 某地10名三岁儿童体重与体表面积 * 11 12 13 14 15 16 4.5 5.0 5.5 6.0 6.5 7.0 可信区间与容许区间示意(confidence band tolerance band) X 体重 Y 体表面积 * 第二节 直线相关 Linear Correlation * 生物遗传学上的“相关” 在回归分析中,有理由认为父亲身高决定儿子身高,故把父亲身高作为自变量X,儿子身高作为应变量Y。 Pearson K(英,1857~1936)在对同一家庭中兄弟与姐妹身高间关系进行分析时,发现两者难以象父亲与儿子身高间关系那样区别自变量X与应变量Y,也不必计算回归方程。 Galton F(英,1822~1911)将这种现象称之为 “相关”。 * 当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关。两个变量有共变现象,称为有相关关系。 相关关系不一定是因果关系。 一、直线相关的概念 * 相互关系示意图 r = 0 (h) r = 0 (f) r=-1 (d) r=1 (b) 0r1 (a) -1r0 (c) r ? 0 (e) r ? 0 (g) 零相关 正相关 负相关 完全正相关 完全负相关 零相关 零相关 零相关 * 相关系数的性质 两变量间的线性关系密切程度与相关方 向用直线相关系数r表示。 -1 ≤ r ≤ 1 r>0为正相关 r<0为负相关 r=0为零相关或无相关 * 二、相关系数的意义与计算 Pearson 相关系数 标准化后的协方差 * * 三、相关系数的统计推断 (一)相关系数的假设检验 尿肌酐含量与年龄之间无直线相关关系 * 附表2 附表13 * (二)总体相关系数的可信区间 相关系数的抽样分布在?≠0时呈偏态分布 Z的1-α可信区间: 变换后r的1-α 可信区间: Z变换后服从正态分布 * 相关系数的抽样分布(|? | = 0.8,n=100,1000次抽样) -0.8 -0.6 -0.4 -0.2 0.0 0 100 200 300 -1.0 0 0.2 0.4 0.6 0.8 1.0 0 100 200 300 ? = - 0.8 ? = 0.8 * R.A. Fisher(1921) 的 z 变换 z 近似服从均数为 , 标准差为 的正态分布。 * 相关系数的z变换值的抽样分布(? = - 0.8) 0 0.5 1.0 1.5 2.0 0 50 100 150 200 -0.8 -0.6 -0.4 -0.2 0.0 0 100 200 300 -1.0 变换前 变换后 * 相关系数的z变换值的抽样分布(? =0.8) 0 1 2 3 4 0 50 100 150 200 0 0.2 0.4 0.6 0.8 1.0 0 100 200 300 变换前 变换后 * 相关系数的可信区间估计 1. 将 r 变换为 z 。 2. 根据 z 服从正态分布,估计 z 的可信区间。 3. 再将 z 变换回 r。 * 求得8名健康成
文档评论(0)