- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学复习7
第7章 回归分析 7.1 变量间关系的度量 变量间的关系 相关关系的类型 相关关系的描述与测度 1.散点图(scatter diagram) 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数(取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数(取值及其意义) 相关系数的显著性检验(检验的步骤) 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b1的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:? ? ? ;H1: ? ? 0 回归模型的类型示意图 一元线性回归 最小二乘估计 离差平方和的分解 (三个平方和的关系) 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差,反映 y 全部数据的离散程度. 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 直线拟合优度 显著性检验 1.线性关系的检验 均方回归MSR=SSR/1 均方残差MSE=SSE/n-2 2.回归系数的检验 回归系数的检验(样本统计量 的分布) 回归系数的检验步骤 回归分析结果的评价 点估计 区间估计 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间 区间估计有两种类型 置信区间估计(confidence interval estimate) 预测区间估计(prediction interval estimate) 置信区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间 ,这一估计区间称为置信区间(confidence interval) E(y0) 在1-?置信水平下的置信区间为 预测区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间(prediction interval) y0在1-?置信水平下的预测区间为 置信区间、预测区间、回归方程 残差(residual) 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示 反映了用估计的回归方程去预测而引起的误差 确定有关误差项?的假定是否成立 检测有影响的观测值 用残差证实模型的假定 残差图(residual plot) 表示残差的图形 关于x的残差图 关于y的残差图 标准化残差图 用于判断误差?的假定是否成立 检测有影响的观测值 残差图(形态及判别) 标准化残差(standardized residual) ? 残差除以它的标准差后得到的数值。计算公式为 是第i个残差的标准差,其计算公式为 标准化残差图 ? 用以直观地判断误差项服从正态分布这一假定是否成立 若假定成立,标准化残差的分布也应服从正态分布 在标准化残差图中,大约有95%的标准化残差在-2到+2之间 本章小结 相关分析 回归模型、回归方程与估计的回归方程 回归直线的拟合优度 回归分析中的显著性检验 估计和预测 124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx) 139 7.1 变量间关系的度量 7.2 一元线性回归 7.3 利用回归方程进行估计和预测 7.4 残差分析 7.1.1 变量间的关系 7.1.2 相关关系的描述与测度 7.1.3 相关系数的显著性检验 1. 确定性关系-函数关系 2. 非确定性关系- 相关关系 相关关系 线性相关 非线性相关 正相关 负相关 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 完全正线性相关 完全负线性相关 ? ? ? ? ? ? ? ? ? ? ? ? 非线性相关 ? ? ? ? ? ? ? ? ? 正线性相关 ? ? ? ? ? ? ?
文档评论(0)