第四章数据分布特征的描述.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

[例4-10]组距式数列计算众数示例收入组别人均收入(元)频数(人)1234562000元以下2000~4000元4000~6000元6000~8000元8000~10000元10000以上234368322410合计-200其众数的近似值为:某地区的人均月收入调查数据表第29页,共54页,星期日,2025年,2月5日三、均值、中位数和众数的比较(一)均值、中位数和众数的数量关系1.当数据呈对称分布的,三者合而为一,如图(a)2.当数据呈左偏分布时,说明数据存在极小值,必然拉动均值向极小值一方靠,则从左至右依次是均值、中位数和众数,如图(b)3.当数据呈右偏分布时,说明数据存在极大值,必然拉动均值向极大值一方靠,则从左至右依次是众数、中位数和均值,如图(c)第30页,共54页,星期日,2025年,2月5日均值、中位数和众数的数量关系1.当数据呈对称分布的,三者合而为一第31页,共54页,星期日,2025年,2月5日均值、中位数和众数的数量关系2.当数据呈左偏分布时,从左至右依次是均值、中位数和众数第32页,共54页,星期日,2025年,2月5日均值、中位数和众数的数量关系3.当数据呈右偏分布时,从左至右依次是众数、中位数和均值,如图c第33页,共54页,星期日,2025年,2月5日三、均值、中位数和众数的比较(二)均值、众数和中位数的特点及应用场合**均值是对数值型数据计算的,利用了全部数据信息,具有优良的数学性质,是实际中应用最广泛的集中趋势测度值**中位数是一组数据中间位置上的代表值,其特点是不受数据极端值的影响,主要适合于作为顺序数据的集中趋势测度值**众数是一组数据分布的峰值,它也是一种位置代表值,不受极端值的影响,主要适合于作为分类数据的集中趋势测度值第34页,共54页,星期日,2025年,2月5日第三节

数据分布离散程度的测定第35页,共54页,星期日,2025年,2月5日一、极差/全距(一)概念:又称全距,是数据中最大值和最小值之差。记为(二)计算1.未分组数据的极差为:表示数据的最大值表示数据的最小值2.分组数据的极差极差=最大组的上限-最小组的下限若存在开口组,则:最大组的上限=前一组的上限+组距最小组的下限=下一组的下限-组距其中:第36页,共54页,星期日,2025年,2月5日[例4-11]对人均月收入分组如下:2000元以下、2000~4000元、……、8000~10000元、10000元以上,计算全距[分析]:其最小组的下限为0最大组的上限为:则全距为:极差/全距的计算示例第37页,共54页,星期日,2025年,2月5日(三)修正极差(modifiedrange)1.概念:是去掉极端值后的极差,又称四分位全距(IQR,interquartilerange),是中间50%的数据的间距,即数据分布中第25个和第75个百分位数的间距,也即第1个和第3个四分位数的间距2.公式:其中:Q3表示第3个四分位数,即第75个百分位数Q1表示第1个四分位数,即第25百分位数第38页,共54页,星期日,2025年,2月5日第1页,共54页,星期日,2025年,2月5日第一节

数据分布集中趋势的测定第2页,共54页,星期日,2025年,2月5日一、均值/平均数/数值平均数(mean)(一)概念是反映数据分布集中趋势十分重要的数据,代表总体单位某一标志值的一般水平(二)特征1.具有抽象性2.具有代表性3.反映总体分布的集中趋势**举例1.某市中学生每周平均上网时间为2.8小时2.某农贸市场2月份牛肉的平均价格为16元/千克3.某地区“十五”期间经济平均增长率为9.6%第3页,共54页,星期日,2025年,2月5日(三)均值的种类及计算1.算术平均数**

文档评论(0)

xiaoshun2024 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档