二章多元线回归multiplelinearregression.pptVIP

二章多元线回归multiplelinearregression.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二章多元线回归multiplelinearregression

第一节 相关和回归 一、相关统计量 用一个数值表示两个变量间的相关程度(无单位度量)(-1~+1) 解读 X与y的相关系数为0.6,x与z的相关系数为0.3 答案: 只能说明x与y相关程度高于x与z的相关程度,但不能说前者是后者的两倍 二、计算相关的思路 定距:数量上的“共变” 定类、定序:“连同发生”——隐含根据一个变量去预测或估计另一个变量的意思 人们正是根据预测的准确程度来界定定类或定序变量之间的关系的——消减误差比例 三、相关测量逻辑展示 (一)Lambda相关测量法 基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测准则,可以减少多少误差 公式: 练习:根据下表数据计算lambda 思考并运算:如果数据有如下变化,lambda值会发生什么变化呢? 存在的问题: 1、Lambda系数以众值为预测准则,不理会众值以外的次数分布,对数据利用率低。 2、因为上述计算方式,如果全部众值集中在条件次数表的同一列或同一行中,则Lambda系数会等于0,相关失去意义 (二)相关系数r 1、协方差的思想 2、r系数计算 3、PRE计算思路 四、回归 注意 回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下展开 一、回归方程与线性回归方程 两变量x与y 对于确定的xi,yi是随机变量,可计算其均值——回归方程是研究自变量不同取值时,y的均值的变化 当因变量y的均值与自变量x呈线性规律时,称线性回归方程 根据x个数不同,分为一元线性回归、多元线性回归 关于模型 现实数据=模型+误差 没有误差的不是模型,是复制 复制很精确,但是往往太不简洁 设置模型一般而言是希望用简洁的方式表述复杂信息,达到较好的精确度 二、回归方程的建立与最小二乘法 回归分析的目的:找出错误最小的方法来预测因变量的数值 拟合思路:各点到待估直线铅直距离之和为最小——最小二乘 原理: (1)散点图 (2)每个x值对应的y的均值,构成回归线(曲折) (3)用最小平方法绘制回归直线 (各个样本个案的估计误差和为误差总数。为避免正负抵消,改为将误差的平方值相加。如果回归直线位置能够使此平方和最小,即为最佳拟和直线) 线性回归方程式不但有简化资料的作用,而且可以推广应用于预测或估计样本以外之个案的数值 回归系数的意义: b值的大小表示每增加一个单位的x值,y值的变化有多大 三、回归方程的假定与检验 (一)基本假定 1、自变量x可以是随机变量,也可以是非随机变量,其误差忽略不计 2、对于每一个x值,yi都是随机变量。Y的所有子总体y1,y2…yn,方差相等 3、y的所有子总体,其均值都在一条直线上——线性假定 4、随机变量yi是统计独立的 5、 y的所有子总体都满足正态分布 (二)检验 F检验 第三节 多元线性回归模型 一、多元的思路 二、回归方程的建立 三、回归方程的解释 四、标准化回归系数 一、多元的思路 关联性 Association 和因果性Causality 统计意义上的关联性很容易发现 , 难的是,如何确立因果联系。 然而我们在研究中更加关心的是因果性的解释。 因果关系存在的必要条件: 1、变量间的关系是strong and consistent; 2、变量间有适当的时序性; 3、变量间的关系不能够被其他变量所解释。 对观察数据的统计控制 我们如何排除其他备选解释? 和实验室的实验不同的是,我们不能控制社会现象发生的环境。 对于观察数据, 因果性问题可以部分地通过统计控制来解决 即, 我们可以把个体根据我们所要控制的特征分成几个小组, 来比较组内的结果变量的差异 对定量变量最常用的统计控制体现在多元回归模型中。 二、回归方程的建立 多元回归系数的估计 首先看只有两个自变量的模型 : 我们仍可以用最小二乘法,使得观测的Y值和预测的Y值的差距的平方和最小。利用微积分, 对三个未知参数a, b1, and b2 求导: 解方程: 这种方法可以扩展到任意多的自变量的模型。 计算机可以直接给出估计的系数。 三、回归方程的解释 在任何情况下, a 始终为当所有自变量为0时的应变量值 (截距) 斜率系数 b1 到 bk 表示在其他变量不变的情况下,相关的X增加一个单位,Y所对应的变化。 规范解读方式 (在其他变量不变的情况下,)xi平均变化一个单位,y平均相应变化bi个单位 四、标准化回归系数 预测与残差 拟合优度 where and 和前面一样, 是衡量 Y的所有变异中由所有自变量的差异共同解释的比例 越高, 模型拟合数据的程度就越好。 当加入新的变量时, 只升不降。 由于常常是随着自变量数目的增加而增加, 所以

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档