变量的关系S.pptVIP

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
变量的关系S

回到例1:相关系数 定量变量的线性回归分析 对例1中的两个变量的数据进行线性回归,就是要找到一条直线来最好地代表散点图中的那些点。 检验问题等 对于系数b1=0的检验 对于拟合的F检验 R2 (决定系数) =SSR/SST,可能会由于独立变量增加而增加(有按自由度修正的决定系数:adjusted R2), 简单回归时R等于相关系数 的绝对值 回到例1:R2等 多个自变量的回归 例子:RISKFAC.sav 不算序号和(192个)国家有21个变量 包括地区(Region)、(在城镇和乡村)使用干净水的%、生活污水处理的%、饮酒量(litre/yearperson)、(每万人中)内科医生数目、护士和助产士数、卫生工作者数、病床数、护士助产士和内科医生之比、卫生开支占总开支的%、占政府开支的%、人均卫生开支$、成人识字率、人均收入$、每千个出生中5岁前死亡人数、人口增长率%、(男女的)预期寿命(年)、每10万生育的母亲死亡数 例子:RISKFAC.sav 该数据有许多相关的变量和许多缺失值 假定要用各种变量描述每千个出生中5岁前死亡人数(因变量) 可以先做两两相关 也可以做定量变量的两两散点图等等 或者用逐步回归淘汰变量 目的在于摸清关系的底细 例子:RISKFAC.sav:相关 例子:RISKFAC.sav:逐步回归 RISKFAC.sav:散点图及自变量相关性Pearson相关 RISKFAC.sav:散点图及自变量相关性 非参数度量 Kendall Spearman 介绍三个检查异常点的统计量 残差(Residual).(本例用SPSS中的一种),它描述了样本点到回归直线的远近程度。 杠杆值(Levarage)。 它描述距离数据总体的远近。高杠杆点对回归的参数影响较大,但其残差通常较小。 Cook统计量。它结合了残差和杠杆值,因此反映了残差和杠杆二者的影响(较全面) RISKFAC.sav: 全模型异常点诊断 高杠杆点 Return Return2 RISKFAC.sav: 全模型异常点诊断 残差 RISKFAC.sav: 全模型异常点诊断 Cook距离 RISKFAC.sav:只用女性预期寿命作为自变量(R) RISKFAC.sav模型1异常点诊断 残差 RISKFAC.sav:只用农村净水使用%(比较) 对该例子(RISKFAC.sav)的结果解释 单独用第一个自变量比单独用第二个较好 模型1(相应于模型)的“异常点”为一些非洲国家;它们可能不适合用这个模型。 模型2(相应于模型)的“异常点”为Romania;它可能不适合用这个模型。 从散点图来看,第一个模型更加线性。 两个自变量的模型的“异常点”为单独模型“异常点”的混合。 其实,用一个自变量就够了。这两个自变量是相关的。当然是用第一个了。可能把异常点排除后再重新建模更好。 自变量中有定性变量的回归 例1的数据中,还有一个自变量是定性变量“收入”,以虚拟变量或哑元(dummy variable)的方式出现;这里收入的“低”,“中”,“高”,用1,2,3来代表.所以,如果要用这种哑元进行前面回归就没有道理了. 以例1数据为例,可以用下面的模型来描述: 自变量中有定性变量的回归 现在只要估计b0, b1,和a1, a2, a3即可。 哑元的各个参数a1, a2, a3本身只有相对意义,无法三个都估计,只能够在有约束条件下才能够得到估计。 约束条件可以有很多选择,一种默认的条件是把一个参数设为0,比如a3=0,这样和它有相对意义的a1和a2就可以估计出来了。 对于例1,对b0, b1, a1, a2, a3的估计分别为28.708, 0.688, -11.066, -4.679, 0。这时的拟合直线有三条,对三种家庭收入各有一条: SPSS实现(hischool.sav) Analize-General linear model-Univariate, 在Options中选择Parameter Estimates, 再在主对话框中把因变量(s1)选入Dependent Variable,把定量自变量(j3)选入Covariate,把定量因变量(income)选入Factor中。 然后再点击Model,在Specify Model中选Custom, 再把两个有关的自变量选入右边,再在下面Building Term中选Main effect。 Continue-OK,就得到结果了(系数和检验等) SPSS Syntax: UNIANOVA s1 BY income WITH j3 /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /DESIGN = incom

文档评论(0)

ipad0d + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档