- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据的频数分析与展示
第3讲 数据的图表展示 3.1 品质数据的图表展示 3.2 数值型数据的图表展示 3.3 合理使用图表 (2)相对数 相对数是两个绝对数的比值,反映事物的相对数量 ● 相对数的表现形式: 比例、比率 比例(Proportion) :一个总体中各个部分的数量占总体数量的比重,通常反映总体的构成或结构。 例5:一数量为N的总体被分为K个部分,各部分的数量分别为 Ni,则比例定义为:Ni/N。显然有: ● 比率(Ration) :各不同类别的数量比值。 2、顺序数据的整理与图示 ■2、顺序数据的处理 3) 累积频数:将各类别频数的逐级累加。 4) 累积频率:将各类别频率的逐级累加。 例3.5 顺序数据的频数分布表(甲城市) ■5、甲乙两城市满意度比较的环形图 (例题3.5) 环形图和饼图的区别 饼图只能显示一个总体(或样本)各部分所占的比例 环形图则可以同时绘制多个总体(或样本)各部分的比例,每一个总体(或样本)的数据系列为一个环。 环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据 总体中的每一部分数据用环中的一段表示 (二)数据分组的方法——组距分组 ①单变量值分组 1. 将一个“变量值”作为一组 2. 适合于“离散变量” 3. 适合于变量值“较少”的情况 ②组距分组 将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 ■3、组距分组的步骤 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K 组距分组的几个概念 1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 ■四、数值型数据分组和频数分布表的编制 确定组数:根据 Sturges 提出的经验公式得组数K为: 3、数字型数据分组后的频数、频率表 ● 开口组——特殊的情况的处理 分组数据的图示(折线图的绘制) ▼思考: 1、对于等距分组的数据,可用距形的高度直接表示频数的分布;对于不等距分组的数据,用距形的面积(而不是高度)表示各组的频数分布。不等距分组各组的频数受组距大小不同的影响。 2、从本质上说,直方图应用频数密度来绘制,这样可使直方图总面积为1。因此需要计算频数密度(=频数/组距),才能准确反映频数分布的实际。而频率和频数密度是有区别的:频率=频数/总量。频率的加总一定等于1;而频数密度的加总不一定等于1. ◇频数(频率)分布的类型 (一)不分组也可以看出数字的特征 茎叶图是一种既给出数据的分布状况,又能显示每一个原始数值的图形。 A stem-and-leaf display can be used to rank order data and provide an idea of the shape of the distribution of a set of quantitative data. 茎叶图由两部分组成:茎(stem)与叶(leaf) 茎:通常由每组数的高位数值(leading digits)形成,按组竖立在左边; 叶:通常由每组数的低位数值(last digits)形成,按组横排在“茎”的右边。 ●上面茎叶显得过于拥挤,尤其是第一行有太多数,可将期扩展为Fig5的形式。 【例3-6】表3.12的茎叶图(p58) 表3.12 扩展的茎叶图 总结:茎叶图(stem-and-leaf display) 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留一位数字 对于n(20? n ?300)个数据,茎叶图最大行数不超过 L = [ 10 × lg(n) ] 6. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 (二)箱线图 (box plot) 未分组数据—多批数据箱线图 (例题分析) 以科目分组的多批数据箱线图(例题分析) 以学生分组的多批数据箱线图 (三)、时间序列数据—线图(line plot) 绘制线图时应注意以下几点 时间一般绘
您可能关注的文档
最近下载
- 2024年高级卫生专业技术资格考试(正高级)试卷及解答参考.docx VIP
- 留学生汉语口语自我效能感的研究.pdf VIP
- 高级卫生专业技术资格考试(正高级)试卷及解答参考.docx VIP
- 高级卫生专业技术资格考试(正高级)试卷及解答参考.docx VIP
- 高级卫生专业技术资格考试(正高级)试卷及解答参考.docx VIP
- 掼蛋比赛活动策划方案.pptx
- 年处理10万吨苯-氯苯筛板精馏塔设计说明书2024.12.17.docx VIP
- 《中国近代史纲要选择题集锦(全)》.doc VIP
- HG-T 2517-2009 工业磷酸三钠.pdf VIP
- 《中国近现代史纲要(2023版)》课后习题答案汇编.doc VIP
文档评论(0)