- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章多元线性回归.ppt
第一节 相关和回归 一、相关统计量 用一个数值表示两个变量间的相关程度(无单位度量)(-1~+1) 解读 X与y的相关系数为0.6,x与z的相关系数为0.3 答案: 只能说明x与y相关程度高于x与z的相关程度,但不能说前者是后者的两倍 二、计算相关的思路 定距:数量上的“共变” 定类、定序:“连同发生”——隐含根据一个变量去预测或估计另一个变量的意思 人们正是根据预测的准确程度来界定定类或定序变量之间的关系的——消减误差比例 三、相关测量逻辑展示 (一)Lambda相关测量法 基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测准则,可以减少多少误差 公式: 练习:根据下表数据计算lambda 思考并运算:如果数据有如下变化,lambda值会发生什么变化呢? 存在的问题: 1、Lambda系数以众值为预测准则,不理会众值以外的次数分布,对数据利用率低。 2、因为上述计算方式,如果全部众值集中在条件次数表的同一列或同一行中,则Lambda系数会等于0,相关失去意义 (二)级序相关法 基本逻辑:根据任何两个个案在某变项上的等级来预测他们在另一个变项上的等级,可以减少的误差是多少 以每对个案之间的相对等级作为预测的准则 同序对 异序对 Gamma系数 计算逻辑: 所有对子,不知道顺序预测,所犯错位总数 按同序对预测的误差 按消减误差比例思路计算 Gamma系数按照同序对和异序对个数来计算两定序变量的相关程度和方向 同序对和异序对相差越大,说明相关越强 同序对大于异序对,表示两变项成正比 如果同序对小于异序对,就是反比 (三)相关系数r 1、协方差的思想 2、r系数计算 3、PRE计算思路 回归是相关分析的深入 回归分析的结果是建立一个数学模型以表达变量之间的关系——在分析观测数据的基础上,确定一个能反映变量之间关系的近似函数表达式 注意 回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下展开 一、回归方程与线性回归方程 两变量x与y 对于确定的xi,yi是随机变量,可计算其均值——回归方程是研究自变量不同取值时,y的均值的变化 当因变量y的均值与自变量x呈线性规律时,称线性回归方程 根据x个数不同,分为一元线性回归、多元线性回归 关于模型 现实数据=模型+误差 没有误差的不是模型,是复制 复制很精确,但是往往太不简洁 设置模型一般而言是希望用简洁的方式表述复杂信息,达到较好的精确度 二、回归方程的建立与最小二乘法 回归分析的目的:找出错误最小的方法来预测因变量的数值 拟合思路:各点到待估直线铅直距离之和为最小——最小二乘 原理: (1)散点图 (2)每个x值对应的y的均值,构成回归线(曲折) (3)用最小平方法绘制回归直线 (各个样本个案的估计误差和为误差总数。为避免正负抵消,改为将误差的平方值相加。如果回归直线位置能够使此平方和最小,即为最佳拟和直线) 线性回归方程式不但有简化资料的作用,而且可以推广应用于预测或估计样本以外之个案的数值 回归系数的意义: b值的大小表示每增加一个单位的x值,y值的变化有多大 三、回归方程的假定与检验 (一)基本假定 1、自变量x可以是随机变量,也可以是非随机变量,其误差忽略不计 2、对于每一个x值,yi都是随机变量。Y的所有子总体y1,y2…yn,方差相等 3、y的所有子总体,其均值都在一条直线上——线性假定 4、随机变量yi是统计独立的 5、 y的所有子总体都满足正态分布 (二)检验 F检验 第三节 多元线性回归模型 一、回归方程的建立 三、标准化回归系数 三、回归系数的置信区间 四、回归系数不显著的原因 第六节 多重共线性及其解决方案 鉴别多重共线性的思路: 选择最优回归方程 第七节 虚拟变量的应用 第八节 计算机操作 第九节 研究实例 研究实例 研究实例 问题 需要判别所考察的因素的重要程度 解决 将回归系数标准化 做法 1、先将变量标准化,再 计算 2、利用回归系数计算 变量 每平均变化一个标准分数, y将平均变化 个标准分数 第四节 方程的解释能力 一、确定系数 二、调整的确定系数 三、多元相关系数 四、偏确定系数 五、偏相关系数 六、方差分析 一、确定系数 (0~1) 回归方程解释的差异与用y均值解释的差异之比 模型中所有变量解释y的变化占总变化的比例 受奇异值影响 散点图 二、调整的确定系数 自变量个数 样本规模 >(1:10) <(1:5) 自变量个数 样本规模 偏高 三、多元相关系数R 复相关系数 (0,1) 模型中各自变量与因变量的整体相关水平 四、偏确定系数 模型中每个自变量对减少余差平方和的边际贡献 反映新加入回归的变量所解释的百分比,它以前一步回归所未
您可能关注的文档
- 第五次作业-排队论参考答案.pdf
- 第五版物理化学第八章习题答案.doc
- 第五章 几种高级数据结构.ppt
- 第五章 社会群体.ppt
- 第五章位置的确定.doc
- 第五章光学习题.doc
- 第五章制定市场调查方案.ppt
- 第五章匀速圆周运动A圆周运动快慢的描述B角速度与线速度的关系.doc
- 第五章发的地方.doc
- 第五章固溶体和非化学计量化合物.doc
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
文档评论(0)