- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数值变量资料的统计分析(二)
第三节 数值型变量资料的统计推断 样本均数的抽样分布 假定某年某地所有13岁女学生身高服从 N(155.4,5.32)。 在该总体中作100次随机抽样,ni = 30 计算每份样本的均数:153.6, 153.1, 154.9,····157.7; 现将这100个样本均数看成新的随机变量编制频数分布表 理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 ,样本均数的标准差为 。 样本均数的抽样分布具有以下特点 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从正态分布; 样本均数的变异较原变量的变异缩小 。 标准误 (standard error) 标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。(区别于标准差) 符号: 计算: 意义:说明均数抽样误差大小 标准差与标准误的区别 第二节 t 分布 t 分布的由来 英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明在正态总体中抽样, 服 从自由度? = n ? 1的t分布,即 ~ t 分布, ? = n ? 1 又称Student t分布(Student’s t-distribution)。t分布是总体均数的区间估计和假设检验的理论基础。 t 分布图形不是一条曲线,而是一簇曲线。 t 分布图形的特征 单峰分布,以0为中心,左右对称。 不同的n(或自由度ν=n-1)有不同的曲线。n(自由度)越小,t 值越分散,曲线越扁平,两侧越分散; 随着自由度? 逐渐增大,t 分布逐渐逼近标准正态分布;当? 趋于? 时,t 分布就完全成为标准正态分布。 可见,t分布曲线下面积95%的界值不是一个常量,随自由度大小不同而变化,为应用方便,可查表得到相应的t界值。 三、总体平均值的可信区间估计总体平均值可信区间(confidence interval,CI)样本平均值 为统计量,总体平均值μ为参数;参数估计——用样本统计量 估计总体参数。参数估计的方法:1.点(值)估计(point estimation):如用样本平均值估计总体平均值。方法简单,但未考虑抽样误差。2.用区间估计(interval estimation):按一定的可信度估计未知总体平均值所在的范围。统计学上习惯用95%(99%)可信区间表示总体平均值μ有95% (99%)的可能性在某一范围内。 估计总体平均值可信区间的三种情况 1. σ已知: 用正态分布规律估计总体平均值可信区间由u分布可知,标准正态曲线下有95%的u值在 (-1.96,1.96) 之间,或(-1.96u1.96) 之间有u变换公式: 2. σ未知,但n足够大(如n>100)时, 用正态分布规律估计总体平均值可信区间。总体平均值95%可信区间为: 四 假设检验的基本思想和步骤 假设检验的基本步骤 (1)建立检验假设, 确定检验水准:α 确定检验水准:α检验水准(size of test) 或显著性水准(significance level): α为选定的临界概率。指在无效假设条件下如果得到如此之差(μ -μ0)及更极端情形的概率P等于或小于α时,就拒绝无效假设H0, 接受备选假设H1。否则不拒绝无效假设H0。 通常把这一临界概率定为α=0.05。与α=0.05对应的临界值为双侧u0.05/2=1.96。 单侧u0.05=1.645。 即如果实际统计量u≥ uα时,则发生的概率P≤α,按检验水准α拒绝H0,接受H1。 如果实际统计量u uα时, 则发生的概率Pα,不拒绝H0。 由于从统计模拟得知,从同一总体抽样100个样本,有5个样本的样本平均值的u u0.05/2。应作出拒绝H0的决定。但这一决定是错误的。故又称α为犯I类错误的概率。 (2) 选定检验方法,计算检验统计量 统计学推断准则: 第四节 t检验和u检验 t检验(ttest)和u检验(u test):两者均可用于样本均数与总体均数的比较,以及两样本均数的比较。 ★ u检验的应用条件:σ已知,或σ未知但n足够大(如n50)。 ★ t检验的应用条件:σ未知,n较小; 要求:①样本来自正态分布总体;
文档评论(0)