- 1、本文档共101页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简单线性相关和回归分析课件.ppt
* 八、共线性诊断 共线性(collinearity)是指回归模型中的自变量之间存在着比较明显的线性相关关系。 共线性对回归模型有很大的危害性: 1.回归模型不可靠,不同的变量选择方法得出的结果不一致。 2.偏回归系数的估计值远离经验值,甚至符号相反。 3.专业上明确的有影响的因素不能纳入方程。 * 共线性诊断的方法: 第一类方法:基于复相关系数: 1.容忍度: 以其中一个xi为因变量,其它x为自变量做回归,获得复相关系数Ri, 容忍度 TOL=1-R2i 容忍度小则说明共线性强。 TOL0.2 或 0.1则说明存在严重的共线性。 * 2.方差膨胀因子VIF: VIF是容忍度的倒数 VIF=1/TOL VIF5 或 10 说明存在严重的共线性。 * 第二类:基于特征根的方法 计算自变量的相关系数阵的特征根,如果有接近于零的特征根,则说明有共线性。 3.条件指数: 条件指数=(最大特征根/最小特征根)1/2 条件指数的值越大说明自变量间共线性的可能性越大。 0条件指数数10 认为没有共线性; 10条件指数数30 认为中等程度的共线性; 条件指数 30 认为有严重共线性。 * * 共线性问题的解决 1.可尝试增大样本量; 2.根据专业知识,认为去除专业上不重要,但带来较强共线性的变量; 3.进行主成分/因子分析,将多个共线性强的自变量综合成少量新的因子(新变量); 4.进行岭回归分析,或通径分析。 * 谢 谢! * * 1.对整个方程的检验: H0: β1= β2= …= βm =0 2.对单个回归系数或常数项的检验: H0: βi= 0 三、方程的显著性检验: * 对整个方程的检验: H0: 回归系数全为零 β1=β2=…=βm=0 H1: 回归系数不全为零 α=0.05 F=MSreg/MSE=26.306 自由度 dfreg=5, dfe=23, P0.001 拒绝H0, 接受H1,认为此回归模型有意义。 * 对偏回归系数进行假设检验: H0: βi=0 H1: βi≠0 α=0.05 t1=-1.962 df1=23 p=0.062α t2=0.023 df2=23 p=0.982α t3=8.079 df3=23 p0.001α t4=0.568 df4=23 p=0.576α t5=0.672 df5=23 p=0.508α 只有铁的偏回归系数有意义。 * 四、筛选有影响的自变量 选择标准:对各自变量的偏回归平方和进行检验,F值大于预先设定的Fα,则将此变量选入或保留在方程内。 偏回归平方和:将某个变量引入方程后所引起的回归平方和增加的部分;或者,将某个变量剔除方程后所引起的回归平方和减少的部分。 例如:将本例中钙剔除后,回归平方和从113.26 变为109.94,则钙的偏回归平方和为113.26-109.94=3.32 * 自变量的选择方法 1. 强行进入法(Enter):为默认选择项,定义的全部自变量均引入方程。 2. 后退法(Backward):先建立一个包含全部自变量的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除为止。 * 3. 前进法(Forward):回归方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无统计学意义的自变量被引入为止。 4. 逐步法(Stepwise):它是前进法和后退法的结合。 5. 消去法(Remove):建立回归方程时,根据设定的条件剔除部分自变量。 * 选用后退法 * 钙保留下来的原因:后退法的默认剔除标准是α0.1 * 最终回归模型: 以血红蛋白含量作为因变量y,钙、镁、铁、锰、铜的含量作为自变量进行多重线性回归分析,变量筛选方法为后退法(backward),剔除标准为p0.1(α)。最后结果只有钙和铁保留在方程中。 其中x1代表钙,x3代表铁 (方程和偏回归系数的检验略) * 两个自变量与因变量的拟合面示意图 * 注意:自变量的选择不是一个单独的数学问题,可以放心地交给计算机自动完成,而必须结合专业知识,综合考察。 1.对因变量确实有影响的,应当选入。 2.不同筛选方法结果不一致时要谨慎,重点考虑共线性的问题。 3.所做出的模型不能视为“最佳”模型,而应视为“局部最优”模型,因为所纳入分析的自变量中常常不能包括全部的影响因素,甚至是很重要的因素。 * 五、标准化偏回归系数 由于各自变量量纲(测量单位)不同,各偏回
文档评论(0)