- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2004年4月 第七讲 多元回归 研究多个变量间的关系,因变量如何受到多个自变量的影响,用多个自变量预测因变量的值。 例: 超市中商品的价格、摆放位置、促销手段如何影响销售量; 如何用客户的个人资料(职业、收入、家庭成员人数、婚姻状况、是否有抵押等)进行信用预测; 连锁旅店的利润主要受哪些因素影响; 如何预测每个客户的流失概率; 如何在达到环保标准的前提下找到最佳生产条件; 如何给二手车定价; 如何预测故障维修时间; 如何定新员工的薪水及解聘员工的补偿金。 1 多元线性回归模型的基本假定 1)自变量是确定性变量,且要求rk(x)=p+1<n,表明矩阵X中的自变量列之间不相关。 2)随机误差项具有0均值和等方差,即 3)正态分布的假定条件为 4) 值是相互独立的 5) 与x之间相互独立 认识R2 总变差的分解:SST=SSR+SSE; 判定系数: R2=SSR/SST; 多重相关系数R; 调整(修正)的判定系数:对回归方程的检验 问题:因变量和所有自变量的集合之间是否存在显著的关系? 检验假设 拒绝域对回归系数的检验 检验假设 检验统计量 拒绝域例:巴特勒运输公司 回归系数的解释 b1=0.0611 当送货次数不变时,行驶里程每增加1英里,行驶时间期望的估计值增加0.0611小时。 b2=0.9234 当行驶里程不变时,送货次数每增加1次,行驶时间平均增加0.9234小时。 例题分析 多重共线性问题 在多元线性回归模型中,多重共线性性(Multicollinearity)是指自变量之间存在线性相关的关系。 多重共线性存在时会使得系数估计的标准误差增大,从而使得相应的t统计量减小和p值增加。我们将无法确定任一自变量对因变量的单独影响。单个系数的符号可能与实际不符。 识别多重共线性性 自变量的相关矩阵:样本相关系数的绝对值大于0.7。 方差膨胀因子(Variance Inflation Factors, 简记作VIF): 刻画了相比多重共线性不存在时回归系数估计的方差增大了多少。VIF越大说明多重共线性问题越严重。 经验法则:VIF 10 诊断你的模型:残差分析 残差分析不仅被用于判断你对模型中误差项所设的假定是否符合,而且还可以检测出异常值和有影响的点。 残差图:由横轴为自变量或者因变量的预测值、纵轴为残差或者学生化残差组成的散点图。 使用残差检验误差项的正态性 正态概率图 异常值的检测 异常值是与其它点显示的趋势不合的点。 检查它是否可能是被错误输入的数据。 检测异常值的方法:散点图;检测有影响的观测值 什么是有影响的观测? 识别影响点的方法: 杠杆率比较大(大于 3(p+1)/n) Cook距离D比较大(1). 其它的内容 使用残差来分析误差项的独立性:Durbin-Watson统计量d 残差对时间的散点图 Durbin-Watson 检验 * * 建立模型(以二元线性回归模型为例 ) 二元线性回归模型: 类似使用最小二乘法进行参数估计 。 回总目录 回本章目录 二元线性回归方程:巴特勒运输公司的主营业务地域为本地,为了建立更好的工作日程表,经理们计划为他们的驾驶员估计日常行驶时间。 【例】一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2010年的有关业务数据。试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义用Excel进行回归 标准残差学生化删除残差 0.78344 0.75938 -0.34962 -0.32654 -0.08334 -0.07720 -1.30929 -1.39494 0.38167 0.35709 0.65431 0.62519 1.68917 2.03187 -1.77372 -2.21314 0.36703 0.34312 -0.77639 -0.75190 巴特勒运输公司的例子 Miles Traveled Number of Deliveries Travel Time HI1 COOK’s D 1004 9.3 0.351704 0.110994 50 3 4.8 0.375863 0.024536 100 4 8.9 0.351704 0.001256 100 2 6.5 0.378451 0.347923 50 2 4.2 0.430220 0.036663 80 2 6.2 0.220557 0.040381 75 3 7.4 0.110009 0.117561 65 4 6.0 0.382657 0.650029 90 3 7.6 0.129
文档评论(0)