- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
106.线性回归分析与独立性检验
一.基本原理
一.相关性检验
1.相关系数:
2.相关系数r的性质
(1)当r0时,称成对样本数据正相关;当r0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
二.线性回归与最小二乘法
1回归直线方程过样本点的中心,是回归直线方程最常用的一个特征
2我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中
3残差的概念
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4刻画回归效果的方式
(i)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(ii)残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(iii)利用刻画回归效果:决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.,越大,即拟合效果越好,越小,模型拟合效果越差.
三.独立性检验
1.2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
2.独立性检验
(1)统计量也可以用来作相关性的度量.越小说明变量之间越独立,越大说明变量之间越相关
.
忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立.我们称为的临界值,这个临界值就可作为判断大小的标准.
(2)独立性检验
基于小概率值α的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(testofindependence).
3.应用独立性检验解决实际问题的大致步骤
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
二.典例分析
例1.(2022年全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
解析:(1)样本中10棵这种树木的根部横截面积的平均值,样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得.则该林区这种树木的总材积量估计为
例2(2022年新高考1卷)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调査了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
60
对照组
10
90
(1)能否有99%的把握认为患该疾病
您可能关注的文档
- 2026《高考数学一轮复习微专题106讲》38 .高考平面向量常见备考策略研究.docx
- 2026《高考数学一轮复习微专题106讲》39.平面向量基本定理与广义坐标系.docx
- 2026《高考数学一轮复习微专题106讲》40. 数量积计算的六种方式.docx
- 2026《高考数学一轮复习微专题106讲》41.三角形的重心与应用.docx
- 2026《高考数学一轮复习微专题106讲》42.三角形的外心及应用.docx
- 2026《高考数学一轮复习微专题106讲》43.从教材到压轴:n维向量的概念与应用.docx
- 2026《高考数学一轮复习微专题106讲》44.费马点问题与应用.docx
- 2026《高考数学一轮复习微专题106讲》45.数学归纳法的原理与应用.docx
- 2026《高考数学一轮复习微专题106讲》46.等差,等比数列中的七大应用.docx
- 2026《高考数学一轮复习微专题106讲》47.递推公式求通项的十大类型.docx
有哪些信誉好的足球投注网站
文档评论(0)