回归分析及独立性检验).docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析与独立性检验 回归分析的含义是什么?有哪些基本步骤?线性回归模型怎样用表达式表示?产生随机误差的原因是什么? 回归方程中 与 怎样求解? 3.刻画回归效果的方式有哪些? (1)残差 (2)残差图 (3)残差图法 (4)残差平方和 (5)相关指数R2 1.判一判(正确的打“√”,错误的打“×”) (1)在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量. (  ) (2)求线性回归方程前可以不进行相关性检验. (  ) (3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.(  ) 2、一位母亲记录了儿子3~9岁的身高数据,并由此建立的身高 与年龄的回归模型为 =7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则下列说法正确的 A.身高一定是145.83cm B.身高在145.83cm以上 C.身高在145.83cm左右 D.身高在145.83cm以下 有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是  A.0     B.1     C.2     D.3 【典例1】(1)(2014·合肥高二检测)已知一个回归方程为 =1.5x+45,x∈{1,7,5,13,19},则 =  A.9 B.45 C.58.5 D.1.5 (2)如图所示的是四个残差图,其中回归模型的拟合效果最好的是(  ) (3)为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如下表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8 出散点图,并求线性回归方程; ②求出R2; ③进行残差分析. 类型二 非线性回归分析 【典例2】(1)两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的 A.y=a·xb B.y=a+blnx C.y=a·ebx D.y=a· 2)在一次抽样调查中,测得样本的5个样本点的数值如下表: x 0.25 0.5 1 2 4 y 16 12 5 2 1 试写出y与x之间的回归方程. 【易错误区】对回归系数的含义理解错误 【典例】(2014·合肥高二检测)废品率x%和每吨生铁成本y(元)之间的回归直线方程为 =256+3x,表明 (  ) A.废品率每增加1%,生铁成本增加259元 B.废品率每增加1%,生铁成本增加3元 C.废品率每增加1%,生铁成本平均每吨增加3元 D.废品率不变,生铁成本为256元 【提升练习】 1.(2014·梅州高二检测)在2012年8月15日那天,某物价部门对本市的5家商场的某商品的一天销售量价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示: 价格 9 9.5 m 10.5 11 销售量 11 n 8 6 5 由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:=-3.2x+40,且m+n=20,则其中的n=    . 2、设三组实验数据(x1,y1),(x2,y2),(x3,y3)的回归直线方程是:=x+,使代数式[y1-(x1+)]2+[y2-(x2+)]2+[y3-(x3+)]2的值最小时,=-,=,(,分别是这三组数据的横、纵坐标的平均数) 若有七组数据列表如下: x 2 3 4 5 6 7 8 y 4 6 5 6.2 8 7.1 8.6 (1)求上表中前三组数据的回归直线方程. (2)若|y1-(x1+)|≤0.2,即称(x1,y1)为(1)中回归直线的拟合“好点”,求后四组数据中拟合“好点”的概率. 分类变量的概念是什么?什么是列联表,什么是2×2列联表? 等高条形图的优点是什么?如何利用等高条形图判断两个变量之间的关系? 3.独立性检验的概念是什么?怎样进行独立性检验? 1.判一判(正确的打“√”,错误的打“×”) (1)事件A与B的检验无关,即两个事件互不影响. (  ) (2)事件A与B关系越密切,K2就越大. (  ) (3)K2的大小是判断事件A与B是否相关的唯一数据. (  ) 2、下列不是分类变量的是 (  ) A.近视   B.身高   C.血压   D.药物反应 类

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档