- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计推断
第4章 统计推断
4.1 样本与抽样分布()总体与样本
总体:调查对象的全体叫总体。
样本:由总体中抽出的若干个体组成的集合叫样本。
统计量:样本的函数叫统计量。例如样本均值:= 和样本方差:S 2 = 都是统计量。
()抽样分布
① 抽样的基本概念前面介绍收集数据的方式有二种:
优点:对每一个个体都进行观测。
全面调查(普查) 要花费大量的时间,人力,物力,财力。
缺点: 对无限总体无法作普查。
容易出现观测误差。
节省资金、节省时间、精确度高。
优点:
抽样调查 对于只有用破坏性实验才能取得数据的总体只能采用抽样调查。
缺点:有抽样误差。
② 样本的二重性:(1)样本特征在某种程度上反映了总体特征。(2)又不能完全精确地反映总体特征。
③ 实际中要解决二个问题:抽样方法。怎样抽(包括方式和容量)才能更合理地反映总体。统计推断。怎样用样本对总体做出科学的推断。随机数表
对于有限总体:(1) n个随机变量与总体X有相同的概率分布。(2) 它们是相互独立的(对每个个体都进行独立观察)。(3) 要保证有限总体中每个可能的样本组合都有相等的概率被抽中。这种抽样方法称作简单随机抽样。如此得到的样本,称简单随机样本简称样本。
实践中怎样保证得到简单随机样本呢?只要样本容量n与总体容量N的比值( 0.05,则先建立抽样框,利用抽签或随机数表连续抽取n个个体就可近似看作为一个简单随机样本。简单随机抽样分有放回抽样,和无放回抽样。但一般采取无放回抽样。这种抽样的特点是每个个体被抽中的概率是不同的,但每个样本作为随机变量的组合被抽中的概率是相同的。
对于无限总体:常采用连续观测的方式获得样本。
()样本平均数的抽样分布
① 设 (x1, x2, …, xn) 是总体x ( N (( , ( 2 ) 的随机样本,=,则
( N(( ,), U = ( N(0, 1)
n ( ∞,( (,样本容量越大,离 ( 越近。
② 当x不服从正态分布时,在n ( 30 条件下,依据中心极限定理可认为,
近服从正态分布N((,)U = 渐近服从N (0, 1)
从实际中看也是这样。例如有8042张发票面额的分组频数表显示该总体是非正态、右偏倚的(文件名:stat06),( = 20,( = 30图1)。以样本容量为 n =3,n = 10,n = 100 各抽取600次,得到关于的三个频数分布图。样本容量的
图1 发票面额的分组频数表 (( = 20,( = 30) 图2 n=3, n=10, n=100的抽样分布(=30.3)
() t分布
t分布密度曲线见图4.。t分布以纵轴对称,也呈钟形。当n为有限值时,t分布的峰值小于正态分布的峰值,而尾部要比正态分布的厚,即t分布呈低峰厚尾特征。当t ( (,t分布趋近于标准正态分布。实际中,当n 30,t分布就很近似于标准正态分布。
t分布的均值和方差分别为
E(t(n) ) = 0 Var(t(n) ) = n / (n -2), n 2
图4. t分布密度曲线
()样本平均数的分布。
t = ( t(n –1)
如果减均值除以的样本标准差,则统计量服从(n –1)个自由度的t分布。当t分布的自由度在30以上时,t分布已经很接近标准正态分布。
学习查t分布表。t0.95(30) = 1.70
()F分布
图4. F分布密度曲线
服从F分布的密度曲线见图4.。F分布密度曲线是单峰的,右偏倚的。随着自由度n1和n2的加大,F分布的众数趋近于1。F分布的分布密度曲线随二个自由度的不同而不同。
学习查F分布表。F0.5 (5, 30) = 2.16。
(7) 样本比率的抽样分布
设容量为N的总体中,具有某种性质的元素数为X个,则关于具有这种性质的元素数的总体比率是
p =
若从该总体中抽取容量为n的样本,具有该种性质的元素数为x,则关于该种元素的样本比率是
=
E() = E(x) =n p = p
Var() =Var (x) ==
对于大样本(n p ( 5, n (1- p) ( 5)依据中心极限定理近似有如下关系成立。
( N( p, )
或
= ( N(0, 1)
4. 参数估计
举几个实际例子
您可能关注的文档
最近下载
- 05G525 吊车轨道联结及车挡(适用于钢吊车梁).pdf
- 2024江西省房屋建筑与装饰工程消耗量定额及统一基价.pptx VIP
- 《一句顶一万句》读书分享.pptx VIP
- IT售前工程师修炼之道-.ppt VIP
- 小升初大量考试真题(共20套).pdf VIP
- 合资公司成立讨论会议纪要(12月11日)(3).docx VIP
- 新概念一册lesson43-44练习册.docx VIP
- GBT-信息技术安全技术个人可识别信息(PII)处理者在公有云中保护PII的实践指南.pdf VIP
- 医院停电应急预案培训记录.docx VIP
- 2024-2025学年高一数学必修一《第一章 集合与常用逻辑用语》测试卷附答案解析.pdf VIP
文档评论(0)