- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二讲 卫生统计学 简单回归分析
第12章 简单回归分析 Simple linear regression analysis 本章内容 第一节 简单线性回归 第二节 线性回归的应用 第三节 残差分析 第四节 非线性回归 英国人类学家 F.Galton首次在《自然遗传》一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端的最大长度)做了测量,发现: 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 。 也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归” “回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。 二、线性回归的概念及其统计描述 (一)直线回归的概念 三、直线回归模型的适用条件(四个假定) 线性 LINEARITY 反应变量均数 ?与X间呈直线关系 ?Y|X= α + ?X 四、直线回归方程的求法 (一)最小二乘法原则 残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。 此直线必然通过点( , )且与纵坐标轴相交于截距a 。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的X值代入回归方程得到一个点的坐标,连接此点与点( , )也可绘出回归直线。 (1) a 为回归直线在 Y 轴上的截距 a 0,表示直线与纵轴的交点在原点的上方; a 0,则交点在原点的下方; a = 0,则回归直线通过原点。 a 的意义: (2) b为回归系数,即直线的斜率 b0,直线从左下方走向右上方,Y随X增大而增大; b0,直线从左上方走向右下方,Y随X增大而减小; b=0,表示直线与X轴平行,X与Y 无直线关系。 估计值 的意义: X=50时, =4177.79, 即体重为50kg 的妇女, 其平均基础代谢之估计为 4177.79(kJ/d); X=60时, =4791.99, 即体重为 60 kg 的妇女, 其平均基础代谢之估计为 6.099 (kJ/d)。 给定X时,Y的估计值。 当 时, 的意义: 残差平方和 (residual sum of squares). 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最小的。(最小二乘) 回归直线的有关性质: (1)直线通过均点 (2)直线上方各点到直线的纵向距离之和等于直线下方各点到直线的纵向距离之和,即: (3)各点到该回归线纵向距离平方和较到其它任何直线者为小。 (4) 五、总体回归系数β的的统计推断 (一)样本回归系数b的标准误 1、方差分析 理解回归中方差分析的基本思想,需要对应变量Y的离均差平方和lYY作分解(如图所示)。 方差分析 注意: (三)总体回归系数β的可信区间 β的1-α双侧可信区间为: 例题:以例11-1资料为例。 本例b=61.4229, 自由度=12,t0.05,12=2.179,Sb=4.8810, 代入公式得参数β的95%置信区间为: 61.4299±2.179×4.8810 =(50.787 ~ 72.59) (四)决定系数(coefficient of determination) 定义为回归平方和与总平方和之比,计算公式为: 第二节 线性回归的应用(估计和预测) 例题: 以上是给定某一X值时所对应的总体均数的置信区间。当同时考虑X的所有可能取值时,总体均数的点估计就是根据样本算得的回归直线: (1-α)置信区间的上下限连起来形成一个弧形区带,称为回归直线的(1-α)置信带(confidence band)。同样,因为其标准误是X的函数,所以在均数( )点处置信带宽度最小,越远离该均数点,置信带宽度越大。
文档评论(0)