- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
§3.1.1 定量变量的图表示:3.茎叶图 在直方图和盒形图中,很难恢复数据的原貌。而另一种图:茎叶图(stem-and-leaf plots)可以恢复数据 以地区1高三男生身高为例(图3.3),茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。 茎叶图 其中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。 §3.1.1 定量变量的图表示:4.散点图 数据会有两个变量,如美国男士和女士初婚年限数据(marriage.txt)。 该数据描述了自1900年到1998年男女第一次婚姻延续的时间。 这里年份是一个变量,婚姻延续时间是第二个变量。由于不可能将所有人的婚姻年限都给出来,所以每年就取了一个中间的值(中位数)作为代表。 散点图 §3.1.2 定性变量的图表示:饼图 定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。 下面用SPSS绘的图3.5(饼图,pie chart)表示了说世界各种主要语言人数的比例(language.txt). 饼图 §3.1.2 定性变量的图表示:条形图 而用同样数据画的图3.6称为条形图(bar chart)。 从每一条可以看出讲各种语言的实际人数,而且分别给出了每个语种中母语和日常使用的人数(在图中并排放置)。条形图显示比例不如饼图直观。 条形图 §3.2 如何用少量数字来概括数据? 大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允许的简化 我们可以用 “平均”,“差距”或百分比等来概括大量数字。 由于定性变量主要是计数,比较简单,常用的概括就是比例或百分比。下面主要介绍关于定量变量的数字描述。 §3.2 如何用少量数字来概括数据? 可用少量所谓汇总统计量或概括统计量(summary statistic)来描述定量变量的数据。 这些数字是从样本数据得来的,因而也是样本的函数, 任何样本的函数,只要不包含总体的未知参数,都称为统计量(statistic)。 样本的随机性决定统计量的随机性(统计量也是随机变量) §3.2 如何用少量数字来概括数据? 概括统计量经常对应于总体的无法观测到的某些参数。 这时,统计量可作为这些参数的估计。一些统计量还可以用来检验样本和假设的总体是否一致。 §3.2 如何用少量数字来概括数据? 注:一些统计量前面有时加上“样本”二字,以区别于总体的同名参数。如“样本均值”和“样本标准差”,以区别于总体均值和总体标准差;但在不会混淆时可以只说“均值”和“标准差”。 统计学 ─从数据到结论 第二章数据的收集 §2.1 数据是怎样得到的? 在自然的未被控制的条件下观测到的数据,称为观测数据(observational data)。 在人工干预和操作情况下收集的数据就称为试验数据(experimental data)。 同学们自己可以举出大量的观测数据和试验数据的例子 §2.2 个体、总体和样本 需要调查北京市民对交通规则的观点;对象是所有市民, 目的是希望知道市民中对该问题的不同看法各自占有的比例 显然,不可能去问所有的北京市民,而只能够问一部分; 并且根据这一部分的观点来理解整个北京市民的总体观点。 §2.2 个体、总体和样本 在这个例子中,单个北京市民的观点称为个体(element) 所有北京市民对这个问题的观点为一个总体(population),总体是包含所有要研究的个体的集合。 §2.2 个体、总体和样本 而调查时问到的那部分市民的观点(也就是部分个体)称为该总体的一个样本(sample),是总体的一部分。 也有可能试图调查所有的人(比如人口普查),那叫做普查(census)。 §2.2 个体、总体和样本 在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simple random sampling), 而这样得到的样本则称为随机样本(random sample)。 §2.2 个体、总体和样本 如果总体是一锅八宝粥,随机样本则是充分搅拌后的八宝粥中的任意一勺 该勺中的八宝粥的成分比例应该和整个一锅粥类似 搅拌越充分,样本的代表性也越好 §2.3 收集数据时的误差 一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样 这种差异不是错误,而是必然会出现的抽样误差(sampling error)。 §
文档评论(0)