[高等教育]统计学3样本数据特征初步分析.pptVIP

[高等教育]统计学3样本数据特征初步分析.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 样本数据特征的 初步分析; 一、整理样本数据 ;2、整理数据 --数据阵列 ; 3、样本数据结构的基本特征:频次与频率;二、样本数据集合的基本特征的延伸:累积频率 当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据xi的频率值累加起来,就得到“小于等于xi”的累积频率。 注:名义级的样本数据集合,不存在累积频率问题。 表示法同上。;整理数据 --频数分布 ;频数分布 ;?定 义;如何将数据转换成表格 ? 哪些重要或必要的信息应当包括在内 ?;频数分布 ;?对于定性变量而言 -- 常常根据变量结果的种类来选择组 ;对于定量变量而言 -- 选择“组数” 和“组宽 ”是主要问题;4. 各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时, W ;例如,为了研究某班100名学生的身高 -- 我们确定将整个数据分成5组,每组宽度相等,W = 10厘米;1. 一张整理有序的表格可以使数据中隐藏的信息清楚地表现出 来 2. 有助于采用图形方式来汇总数据 数据集表格不具有唯一性;频数分布 ;频数分布 ;频数分布 ;茎叶图形 ;茎叶图形 ; 2| 2 3| 0 5 6 6 7 8 9 4| 4 4 5 5| 6| 7| 6;用直观方式显示定量变量 ;用直观方式显示定量变量 --直方图 ;用直观方式显示定量变量 --直方图;用直观方式显示定量变量 --频数多边形 ;身高.;? 定性变量常常用非数值刻度来测量 ?对这些变量可以进行分类 ?可以采用两种最为常见的图形来描述定性变量的分布 ? 饼图 ?条形图 ;? 饼图的圆圈代表了所有观察值的集合 ? 根据定性变量的类型数目将饼图分成几个部分 ? 饼图每一部分的大小与每一类型的相对频数成正比 ;例如,我们可以用饼图来描述某班100名学生的性别分布状况 ;?对于定性变量而言,条形图表示每一类型的百分比或 计数频数 ?每个条形图的高度代表每一类型的百分比或比例 ?条形图的宽度没有意义,所有类型的宽度均相同 ;例如,我们用条形图来显示某班100名学生的性别分布状况;SPSS统计软件给我们的工作带来了方便 ;SPSS统计软件给我们的工作带来了方便 ;集中趋势测度 --未分组数据 ;均值 --;Kim 测验的平均成绩等于 ;?均值对极值表现得非常敏感 ?如果数据中存在极值(或者说数据分布有所偏斜),那么均值就不能很好地测度集中趋势 ; 中位数 (Md) --;举例: 有6名工人组成一个样本,请找出他们每周工资的中位数 151 179 163 142 180 195;Kim的5次测验成绩 又如何呢?;众数 (Mo) --;集中趋势测度 --未分组数据;对两个旅行团的小孩年龄进行了数据调查,以下是调查结果: --;B组 ? age: 9, 14, 8, 10, 13, 7, 9, 11, 16, 10, 12, 9;?均值、中位数和众数之间的关系 --;?均值、中位数和众数之间的关系 --;?均值、中位数和众数之间的关系 --;集中趋势测度 --分组数据 ;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 --分组数据;集中趋势测度 ;举例:;?测度离中趋势最常用的三种方法 --;全距 =最大观察值– 最小观察值 ;离中趋势测度 --未分组数据;标准差可以让我们大致了解数据值距离均值有多远 ;离中趋势测度 --未分组数据;离中趋势测度 --未分组数据;数据分布的经验法则 --;测量数据相对于均值的离中趋势 ;?? 什么时候采用变异系数 (CV) 来测度离中趋势 ??;举例:;CV表示每种商品相对于其自身平均价格的波动幅度 :;离中趋势测度 --分组数据;离中趋势测度 --分组数据;离中趋势测度 --分组数据;离中趋势测度 --分组数据;离中趋势测度 --分组数据;离中趋势测度 --分组数据;样本数据的离散特征 1、四分点 下四分点:把排序后的样本数据集合,分成左右两部分,使左边部分包含25%的样本总个数,使右边包含75%的样本总个数。 上四分点:把排序后的样本数据集合,分成左右两部分,使左边部分包含75%的样本总个数,使右边包含25%的样本总个数。 2、十分点 下十分点:把排序后的样本数据集合,分成左右两部分,使左边部分包含10% 的样本总个数,使右边包含 90% 的样本

文档评论(0)

it + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳春市夕秋图文设计有限公司
IP属地广东
统一社会信用代码/组织机构代码
91441781MA55YY8A1L

1亿VIP精品文档

相关文档