- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元回归补充-已读-课件(PPT-精)
方差膨胀因子(VIF) 给出了多重共线性(multi collinearity)的度量。若 X 之间不存在任何相关性,则 VIF = 1;若 VIF 值为 5 或更高,X之间的相关性很高, 所以您需要接下来使用逐步回归或最佳子集回归寻找合适的自变量,再进行回归。 方差膨胀因子 练习 美国出售的每一辆汽车都需要标明油耗水平,即该车在城市路面和高速公 路路面的行驶时每加仑汽油预期达到的英里数,现在美国能源部收到230 辆汽车的数据,您的任务是建立一个能用来估计在城市路面时的油耗的回 归方程和和能用来估计在城市路面时的油耗的回归方程 自变量有: X1:发动机的排量 X2:气缸数量 打开文件:“12_A_ 多元回归 Muliti Regression. Mpj”中:“汽车.mtw” 练习 一项研究提供了与制造业失业的周数可能有关的一些变量的数据,在这些 变量中,自变量有: X1:工人的年龄 X2:受教育的年限 X3:结婚与否,结婚则取值为“1”,否则为“0” X4:户主吗?如果是户主则“1”,否则为“0” X5:工龄 X6:管理岗位吗?如果是管理岗位为“1”,否则为“0” X7:销售工作吗,如果是则为“1”,否则为“0” 打开文件:“12_A_ 多元回归 Muliti Regression. Mpj”中:“失业.mtw” 要点回顾 回顾一元线性回归应用场合 了解回归的几种类型 了解多元线性回归的应用场合 掌握多元线性回归的分析方法 直接利用回归 先利用逐步回归寻找合适的自变量,再进行回归 先利用最佳子集回归寻找合适的自变量,再进行回归 掌握多元共线性问题的解决办法 24 S可以理解为残差的标准差,越小越好,当S等于0时,R-sq=100% 回归方程为: 需求量 = 11.2 - 1.90 价格 + 0.170 收入 Mallows Cp=1.3, 接近于 自变量的个数+常数项数=3+1=4, 而如果选择X3 X4 X7,Mallows Cp=6.1, 也接近于自变量的个数+常数项数=3+1=4 综合考虑R-Sq调整值(越大越好),可以考虑选择X1 X2 X4,(当然这并非唯一答案,多元回归中通常有多种选择。) 1.经过逐步回归,城市驾驶油耗(英里/加仑)只与发动机排量(升)有关。 方程式为:城市驾驶油耗(英里/加仑) = 33.4 - 4.18 发动机排量(升) 2.高速公路驾驶油耗(英里/加仑) = 41.6 - 2.62 发动机排量(升)- 0.942 发动机气缸数(4,6,8) 回归方程为: 失业周数 = 22.9 + 1.51 年龄 - 0.613 受教育年限 - 10.7 结婚与否 - 19.8 户主吗 + 0.426 工龄 - 26.7 管理职位吗 - 18.6 销售工作吗 多元回归选择合适模型的其他方法 在上题中使用 Minitab 中的回归程序,来看看我们如何找到合适数量的输入变量预测Y。七个变量中哪些变量与Y的关系密切,最佳回归模型中应该包含哪些因子?显然使用回归的方法效率太低! 那是否存在更好的缩减因子,选择最佳拟合模型的方法呢?我们可以考虑如下步骤: 步骤1: 我们将讨论 多元回归时选择最佳模型的两种不同的方法: 方法1:逐步 此程序筛选所有输入,以产生 “最佳” 的模型 方法2:最佳子集 此程序提供最佳单变量、双变量、三变量等模型,但在处理多输入变量时会耗費大量时间。 步骤2: 回归 一旦最佳模型被选定后,回归程序将用该模型实施更详细的分析,我们同时会执行残差分析 步骤1的方法1:逐步回归 逐步回归分析菜单 响应是我们需要预测的Y值,预测变量X1~X7全部选入。 若大于,则从模型中删除该变量,再重复上述操作过程。如果没有任何自变量可以删除,则会尝试再加入一个新的自变量,重复上述操作,直至不能再引入也不能再删除为止。 逐步回归分析法就是让计算机自动进行多元回归分析中的自变量筛选工作。主要有三种方法: (1)逐步(向前或向后)的方法是:自变量逐个引入,边引入边检查已引入自变量中最大的p值是否已大于指定的“删除α值”, 逐步回归 逐步回归 (2)前进法是:逐个引入自变量,先引入对y影响最大(p值最小者),再从其余自变量中寻找影响次大者, (p值次最小者),直到无任何变量p值小于指定的“选入α值”可以被引入为止,在前进法中,一旦被加进回归模型中,就不能再被删除。 逐步回归 (3)后退法:一开始引入全部自变量,对于p值大于指定的“删除α值”,逐个删除,直至不能再删除为止。 常用的删除α值使用0.1 上案例中使用的是 逐步(向前或向后) 方法 范例2:钢材产量与其他经济变量 逐步回归结果 此处显示 X1,X2,X4是最佳的模型中的预测变
文档评论(0)