2026《高考数学一轮复习微专题106讲》106. 回归分析与独立性检验.docxVIP

2026《高考数学一轮复习微专题106讲》106. 回归分析与独立性检验.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

106.线性回归分析与独立性检验

一.基本原理

一.相关性检验

1.相关系数:

2.相关系数r的性质

(1)当r0时,称成对样本数据正相关;当r0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.

(2)样本相关系数r的取值范围为[-1,1].

当|r|越接近1时,成对样本数据的线性相关程度越强;

当|r|越接近0时,成对样本数据的线性相关程度越弱.

二.线性回归与最小二乘法

1回归直线方程过样本点的中心,是回归直线方程最常用的一个特征

2我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中

3残差的概念

对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.

4刻画回归效果的方式

(i)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.

(ii)残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.

(iii)利用刻画回归效果:决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.,越大,即拟合效果越好,越小,模型拟合效果越差.

三.独立性检验

1.2×2列联表

一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为

y1

y2

合计

x1

a

b

a+b

x2

c

d

c+d

合计

a+c

b+d

a+b+c+d

2.独立性检验

(1)统计量也可以用来作相关性的度量.越小说明变量之间越独立,越大说明变量之间越相关

.

忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立.我们称为的临界值,这个临界值就可作为判断大小的标准.

(2)独立性检验

基于小概率值α的检验规则是:

当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;

当时,我们没有充分证据推断H0不成立,可以认为X和Y独立.

这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).

3.应用独立性检验解决实际问题的大致步骤

(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;

(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;

(3)根据检验规则得出推断结论;

(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.

二.典例分析

例1.(2022年全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:

样本号

1

2

3

4

5

6

7

8

9

10

总和

根部横截面积

0.04

0.06

0.04

0.08

0.08

0.05

0.05

0.07

0.07

0.06

0.6

材积量

0.25

0.40

0.22

0.54

0.51

0.34

0.36

0.46

0.42

0.40

3.9

并计算得,,.

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.

附:相关系数,.

解析:(1)样本中10棵这种树木的根部横截面积的平均值,样本中10棵这种树木的材积量的平均值

据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为

(2)

(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得.则该林区这种树木的总材积量估计为

例2(2022年新高考1卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调査了100人(称为对照组),得到如下数据:

不够良好

良好

病例组

60

对照组

10

90

(1)能否有99%的把握认为患该疾病

文档评论(0)

136****2689 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证 该用户于2024年08月15日上传了教师资格证

1亿VIP精品文档

相关文档