直线相关与回归Linearcorrelationandregression.pptVIP

直线相关与回归Linearcorrelationandregression.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
直线相关与回归 Linear correlation and regression 直线相关与回归 前面介绍的统计方法都只涉及单一变量,即或进行两组或多组比较,所比较的仍然是同一变量,而且是以讨论各组间该变量的相差是否显著为中心环节。 医学领域里常可在一个统一体中遇到两个或多个变量之间存在着相互联系、相互制约的情况 . 如:同一批水样的浊度与透光率,同一批人的年龄与血压以及身长、体重与胸围等。 如何研究变量之间的关系? 在统计方法中通常是用相关与回归的方法来研究不同变量之间的这种相互依存和互为消长的关系。 相关与回归即有区别又有联系,表达事物或现象间的在数量方面相互关系的密切程度用相关系数;说明一变量依另一变量的消长而变动的规律用回归方程。 数量关系的特点? 函数关系: 确定。例如园周长与半径:y=2πr 。一一对应关系。 回归关系:不确定。例如血压和年龄的关系。 具有相同年龄的人,血压不一定相同。但在一定年龄范围内的人,其血压会在一定范围内波动。年龄与血压之间有一定的趋势。 直线相关 linear correlation 相关 ---- 变量间的互依关系 直线相关(linear correlation)也叫简单相关(simple correlation),用于双变量正态分布资料。 为判断两事物数量间有无相关,可先将两组变量中一对对数值在普通方格纸上作散点图 各种相关关系示意图 一、直线相关系数 r 相关分析是用相关系数(r)来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。 又称积差相关系数(coefficient of product–moment correlation),或 Pearson 相关系数(软件中常用此名称)说明相关的密切程度和方向的指标。 r --样本相关系数 ρ--总体相关系数 相关系数的意义 相关系数:说明具有直线关系的两变量间,相关方向与密切程度的统计指标。 相关系数 r 没有单位,在-1~+1范围变动, 符号表示相关的方向,大小表示相关的程度。 r 0,正相关;r 0,负相关;r= 1, -1, 完全相关; r= 0, 零相关(无直线关系),但不能表达直线以外的关系(如各种曲线)。 正相关——见图1,各点分布呈椭圆形,Y随X的增加而增加,X亦随Y的增加而增加,此时1r0。椭圆范围内各点的排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,r=1(见图2),称为完全正相关。 负相关——见图3,各点分布亦呈椭圆形,Y随X的增加而减少,X也随Y的增加而减少,此时0r-1。各点排列愈接近其长轴,相关愈密切,当所有点都在长轴上时,r=1(见图4),称为完全负相关。 生物现象中,完全正相关或完全负相关甚为少见。 无相关——见图5、6和7,X不论增加或减少,Y的大小不受其影响;反之亦然。此时r=0。另外,须注意有时虽然各点密集于一条直线,但该直线与X轴或Y轴平行,即X与Y的消长互不影响,这种情况仍为无相关。 非线性相关——见图8,图中各点的排列不呈直线趋势,呈某种曲线形状,此时r≈0,称为非线性相关。 |r|=0.7, 高度相关; 0.4=|r|0.7,中度相关; |r|0.4, 低度相关; 举例: 测定15名健康成人血液的凝血酶浓度(单位/毫升)及血液的凝固时间(秒),测定结果记录于表第(2)、(3)栏,问血凝时间与凝血酶浓度间有无相关? 2.求出∑X、∑Y、∑X2、∑Y2、∑XY ∑X=15.1 ∑Y=222 ∑XY=221.7  ∑X2=15.41 ∑Y2=3304 3. 代入公式,求出r值。r=-0.9070 负值表示血凝时间随凝血酶浓度的增高而缩短;绝对值∣-0.9070∣表示这一关系的密切程度。 此相关系数是否显著,则要经过下面的分析。    虽然样本相关系数r可作为总体相关系数ρ的估计值,但从相关系数ρ=0的总体中抽出的样本,计算其相关系数r,因为有抽样误差,故不一定是0,要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体,必须进行显著性检验。 r≠0原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0 相关系数假设检验的过程 (一)t检验 由于来自ρ=0的总体的所有样本相关系数呈对称分布,故r的显著性可用t检验来进行。 零假设:ρ=0,备择假设: ρ≠0 r与0的差别是否显著要按该样本来自ρ=0总体的概率而定。 如果从ρ=0的总体中取得某r值的概率P0.05,就接受假设,认为此r很可能是从此总体中取得的。因此

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档