第二讲多元回归与建模试卷.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Residual over time Residual vs. predicted y The errors are not independent The error variance is constant The modified regression model TICKETS=b0+ b1SNOWFALL+ b2TEMPERATURE+ b3YEARS+e All the required conditions are met for this model. The fit of this model is high R2 = 0.74. The model is useful. Significance F = 5.93 E-5. SNOWFALL and YEARS are significant. TEMPERATURE is not significant. * “没有哪一个模型是对的,但是的确有一些模型是好的。” 回归模型的建立 * 一般线性模型 模拟曲线关系 交互作用 包含因变量的变换 内蕴线性的非线性模型 * 模拟曲线关系 例:雷诺兹公司管理人员希望对公司销售人员工作年限的长短和电子实验室天平的销售数量之间的关系进行调研。 * 交互作用 例:泰勒为他的一种新的洗发产品进行的回归研究。 * * * 考虑交互作用的模型 建立下面的模型 怎样检验交互作用是否存在? H0:??=0 * 包含因变量的变换 经常用来修正非常数方差。 Box-Cox变换 常用变换:对数 倒数 * 内蕴线性的非线性模型 常见于指数模型 * 自变量的选择 逐步回归 必须预先为F统计量设定终止值:Fenter, Fremove 最佳子集 选取准则: (1) R2 或Adj R2 (大,接近1好) Cp() (3) 预报平方和准则(PRESS) (4) AIC准则(越小越好) 例题:肝手术病人的生存时间的研究 预后指数 (前6组): …… …… …… 预后指数 预后指数 * 总结:如何建立一个回归模型? 1、正确选择自变量和因变量(需要考虑交互作用吗?是否需要进行必要的变换?需要虚拟变量吗?); 2、正确使用计算机软件建立回归模型; 3、查看残差图(线性假设成立吗?存在异 方差吗?有异常值或影响点存在吗?); 4、判断是否存在多重共线性问题; * 总结:如何建立一个回归模型? 5、小心地处理系数的p值比较大的变量,区别VIF比较大和VIF比较小的情况。切记:你不应该马上把那些p值较大的自变量都消除! 6、你可以尝试使用软件提供的变量选择过程建立模型。(但是你要明白选择出什么样的模型仍然是由你来控制的。) 7、无论如何再回到第3步都是有益的! 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * * 第二讲 多元回归与建模 * 研究多个变量间的关系,因变量如何受到多个自变量的影响,用多个自变量预测因变量的值。 例: 超市中商品的价格、摆放位置、促销手段如何影响销售量; 如何用客户的个人资料(职业、收入、家庭成员人数、婚姻状况、是否有抵押等)进行信用预测; 连锁旅店的利润主要受哪些因素影响; 如何预测每个客户的流失概率; 如何在达到环保标准的前提下找到最佳生产条件; 如何给二手车定价; 如何预测故障维修时间; 如何定新员工的薪水及解聘员工的补偿金。 * * X2 X1 Y ?i * 认识R2 总变差的分解:SST=SSR+SSE; 判定系数: R2=SSR/SST; 多重相关系数R; 调整(修正)的判定系数: * 对回归方程的检验 问题:因变量和所有自变量的集合之间是否存在显著的关系? 检验假设 拒绝域 * 对回归系数的检验 检验假设 检验统计量 拒绝域 * 例:巴特勒运输公司 巴特勒运输公司的主营业务地域为本地,为了建立更好的工作日程表,经理们计划为他们的驾驶员估计日常行驶时间。 * * * 回归系数的解释 b1=0.0611 当送货次数不变时,行驶里程每增加1英里,行驶时间

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档