- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11单元 相关回归
第十一章 双变量相关与回归 simple linear correlation and regression 分析方法之一: 将10名儿童按体重分为两组(三组……) 结论:体重较重的一组3岁男孩,体表面积越大 分析方法二: 如果想得到的结论为: 体重越大,体表面积越大: 关联的密切程度 (相关分析) 体重为X时,体表面积估计为多少? 数量依存关系 (回归分析) 相关分析与回归分析 本章主要内容 第一节 直线相关 第二节 直线回归 第三节 注意事项 区别与联系 图 相关系数示意图 图 相关系数示意图 二、相关系数 (correlation coefficient) 样本的相关系数用 r 表示 -1 ≤r≤ 1; |r|越接近1,两变量的关联程度越强, |r|越接近0,两变量的关联程度越弱; 正相关时, 0 r 1,两变量同向变化;负相关时, -1r0,两变量异向变化; |r|=1 --- 完全相关,|r|=0 --- 零相关。 一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关; 于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。 问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关? 分析问题:总体-样本、 目的、变量、关系 ∑X=534 ∑Y=99.2 ∑ X2=9876 ∑ Y2=324.8 ∑XY=1750 N=31 我们能否得出结论: 待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61。为什么? 相关系数的假设检验 r≠0原因: ① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0 三、直线相关的意义 1、 在确实存在相关关系的前提下,如果|r|越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果|r|越小,则说明两个变量之间的关系越弱,一个变量的信息对预测另一个变量的值无多大帮助。 2、 一般说来,当n较大,并对r进行假设检验,有统计学意义时,当: |r|0.7 两个变量高度相关; 0.4|r| 0.7 两个变量之间中度相关; 0.2|r| 0.4 两个变量低度相关。 雌三醇含量与产儿体重有相关关系: 如果知道了一位待产妇的尿雌三醇含量 能推断出产儿的体重吗? 能预测产儿的体重可能在什么范围内? 这要用直线回归的方法来解决。 我们常通过可测或易测的变量对未知和难测的 变量进行估计,以达到预测的目的。 知道了两个变量之间有直线相关关系,并且一个变量的变化会引起另一个变量的变化,这时,如果它们之间存在准确、严格的关系,它们的变化可用函数方程来表示,叫它们是函数关系(确定性关系),它们之间的关系式叫函数方程。 Galton数据散点图(英寸) 一、 直线回归方程 一般表达式: 或 直线回归模型的适用条件(LINE) 因变量Y与自变量X呈线性关系 LINEARITY 反应变量均数 ?与X间呈直线关系 ?Y|X= α + ?X 二、回归方程参数的计算 最小二乘法原则 (least square method):使各实际散点(Y)到直线( )的纵向距离的平方和最小。即使 最小。 最小二乘 (Least squares)法图解 回归系数的计算 回归直线的描绘 根据求得的回归方程,可以在自变量X的实测范围内任取两个值,代入方程中,求得相应的两个Y值,以这两对数据找出对应的两个坐标点,将两点连接为一条直线,就是该方程的回归直线。 回归直线一定经过(0,a ),( )。 这两点可以用来核对图线绘制是否正确。 三、回归参数的假设检验 b≠0原因:① 由于抽样误差引起,总体回归系数 β=0 ② 存在回归关系,总体回归系数 β≠0 剩余(残差)标准差 SY|X 回归系数的假设检验 H0:β=0,H1:β≠0 α=0.05 计算统计量: t=4.14; ?=31-2=29,t 0.05(29) =2.045 计算概率值P: P0.05 做出推论:按?=
文档评论(0)