- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第3节成对数据的统计分析
课标要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.
【知识梳理】
1.变量的相关关系
(1)相关关系的分类:正相关和负相关.
(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
2.样本相关系数
(1)相关系数r的计算
变量x和变量y的样本相关系数r的计算公式如:r=n∑
(2)相关系数r的性质
①当r0时,称成对样本数据正相关;当r0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
②样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将y=bx+a称为Y关于x的经验回归方程,其中
b
(2)决定系数
R2=1-n∑i=1(yi-yi)2n∑i=1
4.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
记n=a+b+c+d,则随机变量χ2=n(
(2)独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
[常用结论与微点提醒]
1.求解经验回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本点的中心(x,y).
2.根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两个分类变量有关的把握越大.
3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
【诊断自测】概念思考辨析+教材经典改编
1.思考辨析(在括号内打“√”或“×”)
(1)散点图无法判断两个变量是否相关.()
(2)通过经验回归方程y=bx+a可以估计预报变量的取值和变化趋势.()
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()
(4)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越小.()
答案(1)×(2)√(3)√(4)×
解析(1)散点图是判断两个变量是否相关的一种重要方法和手段.
(4)χ2的值越大,相关性越强,关系越密切.
2.(人教B选修二P121T3原题)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
答案A
解析因为-0.10,所以x与y负相关,
又因为变量y与z正相关,所以x与z负相关.
3.(苏教选修二P169T1改编)某小吃店的日盈利y(单位:百元)与当天平均气温x(单位:℃)之间有如下数据:
x/℃
-2
-1
0
1
2
y/百元
5
4
2
2
1
甲、乙、丙3位同学对上述数据进行了分析,发现y与x之间具有线性相关关系,下列回归方程正确的是()
A.y=-x+2.8 B.y=-x+3
C.y=-1.2x+2.6 D.y=x-0.8
答案A
解析计算得x=15(-2-1+0+1+2)=0
y=15(5+4+2+2+1)=2.8
回归直线必过(0,2.8),故只有A项满足.
4.(人教A选修三P139T3改编)根据分类变量x与y的观测数据,计算得到χ2=3.974.依据α=0.05的独立性检验,结论为x与y(填独立、不独立),这个结论犯错误的概率不超过.?
附:
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
答案不独立0.05
解析因为3.9743.841,所以假设不成立,即认为x,y不独立,
这个结论犯错误的概率不超过0.05.
考点一成对数据的相关性
例1(1)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是()
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度
文档评论(0)