2.数理统计基本概念教程.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.数理统计基本概念教程

第Ⅱ部分:数理统计(Statistics);为什么要学习统计?;几个统计故事;1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐.《文学文摘》(Literary Digest)杂志对结果进行了调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370∶161的优势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,一个名叫乔治·盖洛普的人,对《文学文摘》调查结果的可信度提出质疑.他也组织了抽样调查,进行民意测验.他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福赢得了2770万张民众选票,兰登得到1600万张选票;罗斯福赢得了除缅因州、佛蒙特州以外48个州的民众选票,获得选举团523张选票的98%强,而兰登的选票低于2%(8张).最终,罗斯福以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销声匿迹,而盖洛普则名声大噪.;1.数理统计基本概念;有限总体(finite population):总体中包含的个体数目有限,这种总体称为有限总体。 观察值(observation):每一个体的某一个性状、特性的测定数值叫做观察值。 参数(parameter):由总体的全部观察值而算得的总体特征数,如总体平均数,称为参数。;样本(sample):从总体中抽出的一部分个体的集合。 估计值(estimate):由样本函数确定的总体相应参数的函数值。 随机样本(random sample):从总体中随机抽取的样本,满足随机性和等可能性。 样本容量(sample size):样本中包含的个体数,用n表示。 ;2.数据整理与描述;2.1 数据资料的性质与分类;二、质量性状资料 质量性状(qualitative trait):指能观察而不能量测的性状。 1、统计次数法 2、给予每类性状以相对数量的方法。;2.2 数据频数或频率分布表;2、200个稻穗每穗粒数的次数(频数)分布表;二、连续性变量资料的整理 对于此类情况,一般的处理步骤是: 1、数据排序(sort) 2、求极差(range) R=Max(1…n)-Min (1…n) 3、确定组数和组??(class interval)      组距=R/组数 因而必须先确定组数。组数的确定,可参照以下的因素: (1)观察值个数的多少;(2)极差的大小;(3)便于计算;(4)能反应出资料的真实面貌。; 4、选定组限(class limit)和组中点值(组值,class value)首先选定第一组的中点值,这一点选定后,则该组组限确定,其余各组的中点值和组限也随之确定。第一组的中点值以最接近最小观察值为好,这样可以避免第一组内次数过多,能正确地反映资料的规律性。 每组有两个组限,数值小的为下限(lower limit),数值大的为上限(upper limit)。 5、观察值按分组数列的各组组限归组。 ; 以140行水稻试验的产量为例,(数据略。)其中极差:R=254-75=179g 观察值的个数为140,可分8-16组,假定分为12组,则组距=179/12=14.9,为方便起见,组距定为15g。 数据分组频数统计表如下: ;140行水稻产量的频数分布;三、属性变量资料的整理 把资料按各种质量性状进行分类,分类数等于组数,然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。下表是某水稻杂种二代植株米粒的分离情况:;2.3 数据频数或频率分布图 ;140行水稻产量频数分布方柱形图;二、多边形图 多边形图(polygon),以每组中点值为横坐标,以频数为纵坐标。;三、条形图 条形图(bar diagram)适用于间断性变量和属性变量资料。一般横坐标表示间断的中点值或分类性状,纵坐标表示频数。;四、饼图 饼图(pie diagram)适用于间断性和属性资料,用以表示这些变量中各种属性或各种间断性数据观察值在总观察值个数中的百分比。 ;利用Excel作图;3. 常用样本特征;3.1 平均数;3.1.1 平均数的意义和种类;2、中位数(median):将资料内所有观察值从大到小排列,居中间位置的观察值称为中位数,记作Md 例如: 1、2、3、4、5 的中位数是3 1、2、3、4、5、6 的中位数是: (3+4)/2=3.5;3、众数(mode):资料中最常见的一数,或次数最多一组的中点值,称为众数,记为Mo。 例如:在资料23、2

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档