统计学期末复习重点第六章相关分析与回归分析.pptVIP

统计学期末复习重点第六章相关分析与回归分析.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 相关分析与回归分析;本 章 结 构;相关分析;相关关系的种类;涵义 利用一个指标来反映现象间相互依存关系的密切程度。用相关系数r来表示。 特点 可以了解现象间的相关方向和程度 相关分析中所涉及的现象间地位是平等的,不存在自变量与因变量之分。;相关表和相关图; 现从某班同学中抽取10位同学期末考试的 数学与统计学成绩资料如表6-2所示 表6-2 数学与统计学成绩 将数学成绩按从小到大的顺序排列,可编制相关表如表6-3所示 表6-3数学与统计学成绩相关表 ; (二) 相关图;根据表6-3绘制相关图;散点图; 相关系数 单相关系数的含义 单相关分析是对两个变量之间的线性相关程度进行分析 对两个变量之间线性相关强度的度量称为单相关系数 总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数,记为? 若相关系数是根据样本数据计算的,则称为样本相关系数,记为 r; 相关系数的计算;单相关系数的特点 (1)??r只是对x与y的线性相关关系的度量。 (2)??? 0 ? ?r? ? 1; (3)??? r = 0 时,x与y没有线性关系; (4)??? 0 ? ?r? ? 1,x与y存在一定的线性关系; (5)??? ?r?=1,x与y完全线性相关;;例 万象集团公司下属公司1月份的销售总额与利润总额的资料如表6-4所示。试问该公司的销售总额与利润总额之间是否存在相关关系; 相关系数计算表;单相关系数的检验;根据例6-1,当α=0.05时,r≈0.9261,试问该公司的销售收入与利润总额之间是否存在显著的线性相关关系? ;回归分析;相关分析与回归分析的关系;相关分析与回归分析的关系;一元线性回归模型; 上式表明:在X值给定的条件下,Y的期望值是X的严密的线性函数。Y的实际观测值并不一定位于该直线上,只是散布在该直线周围。各实际观测点与总体回归线垂直方向的间隔,称为随机误差项 ;误差项的标准假定 假定1:误差项 是一个期望值为0的随机变量,即 假定2:对于所有的X值,误差项 的方差为常数σ2 假定3:误差项之间不存在自相关关系,其协方差为0 假定4:误差性 是一个服从正态分布的随机变量,且独立,即 ~N(0,σ2) 假定5:自变量是给定的变量,与随机误差项线性无关 满足以上标准假定的一元线性模型,称为标准的一元线性回归模型 ;样本回归函数 样本一元线性回归模型可表示为: 实际观测到的因变量 值,并不完全等于 如果用εi表示两者之差,即有: ;样本回归函数与总体回归函数的区别与联系: 区别:第一,总体回归线是未知的,只有一条;样本回归线是根据样本数据拟合的,可以是多条 第二,总体回归函数中 和 是未知的参数,表现为常数;样本回归函数中 和 是随机变量,其具体数值由所抽取的样本观测值决定 第三,总体回归函数中的 是 与未知的总体回归线之间的距离,是不可直接观测;样本回归函数中的 是 与样本回归线之间的距离 ,可以计算出具体的数值 ;一元线性回归模型的估计;对Q分别求对应于 和 的偏导数得: 根据上述方程组可得: ;例 根据例6-1的资料。拟合直线回归方程。;标准误差的估计;估计标准误差的自由度;注意:S越小表明实际观测点与所拟合的样本回归线的离差程度越小,即回归线具有较强的代表性;反之,S越大表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差 S经过简化,其计算公式为: ;一元线性回归模型的检验;回归方程的拟合优度评价;判定系数的定义 判定系数是建立在对总离差平方和进行分解的基础上。 可以分解为两部分: 一部分是因变量的理论回归值与其样本均值的离差 ,它可以看成是能够由回归直线解释的部分,称为可解释离差 另一部分是实际观测值与理论回归值的离差 ,它是不能由回归直线加以解释的残差;将总离差方程的两边平方,并对所有n个点求和,有: 即:SST=SSR-SSE SST是总离差平方和; SSR是由回归直线可以解释的那一部分离差平方和,称为回归平方和,反映自变量X的变化对因变量Y取值变化的影响; SSE是用回归直线无法解释的离差平方和,称为残差平方和,反映除X以外的其他因素对Y取值的影响,也称为不可解释平方和或剩余平方和;各个样本观测点与样本回归直线靠的越紧,SSR在SST中所占的比例就越大,并将这一比例定义为判定系数,

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档