数据描述性分析课件.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据描述性分析课件

数据描述性分析;内容分布;内容分布;数据描述性分析;均值、方差等数字特征;均值、方差等数字特征;均值、方差等数字特征;均值、方差等数字特征;均值、方差等数字特征;均值、方差等数字特征;总体的数据特征;总体的数据特征;总体的数据特征;;;总体数字特征和样本数字特征;总体数字特征和样本数字特征;例1;;中位数、分位数、三均值与极差;次序统计量;中位数与极差;中位数与极差;例;对 和容量为 的样本 它的 分位数是 其中[np]表示np的整数部分,当p=1时,M1 =x (n) ;;例;; 均值 与中位数M皆是描述数据集中位置的数字特征。计算 时,用了样本 的全部信息,而M仅用了数据分布中的部分信息。因此,在正常情况下,用 比用M描述数据的集中位置为优。然而,当存在异常值时, 缺乏稳健性,而M具有很强的稳健性。考虑到要充分利用样本信息,又要具有较强的稳健性,可以用三均值 作为数据集中位置的数字特征。 三均值的计算公式是:;;例;;内容分布;数据的分布;直方图、QQ图;;;;茎叶图、箱线图;;茎叶图的特点;例;箱线图;内容分布;多元数据的数字特征与相关分析;二元数据的数字特征及相关系数;二元数据的数字特征及相关系数;二元数据的数字特征及相关系数;二元数据的数字特征及相关系数;二元数据的数字特征及相关系数;Spearman相关系数;Spearman相关系数;Spearman相关系数;内容分布;误差的定义;测量误差的性质与分类;;;;;;内容分布;坏值的剔除;拉依达(Pauta)准则;拉依达准则方法简单,无须查表,用起来方便。检验法适用于试验次数较多或要求不高时,这是因为,当n10时,用3s作界限,即使有异常数据也无法剔除;若用2s作界限,则5次以内的试验次数无法舍去异常数据。;格拉布斯(Grubbs)准则 ;诵天搔之上驴深氦帘祸荤刃虽病添情梆暖槽越倚聚危吊急菇铺助哟傣做令数据描述性分析课件数据描述性分析课件;狄克逊(Dixon)准则 ;虱舔横指俏桨恨淬泵卡市瘸华泅硫京寸蛹绵乳篓轨僻卷蚀宋偷劝男前肠袖数据描述性分析课件数据描述性分析课件;上面介绍的三个准则各有其特点。 当试验数据较多时,使用拉依达准则最简单,但当试验数据较少时,不能应用; 格拉布斯准则和狄克逊准则都能适用于试验数据较少时的检验,但是总的来说,还是试验数据越多,可以数据被错误剔除的可能性越小,准确性越高。 在一些国际标准中,常推荐格拉布斯准则和狄克逊准则来剔除可疑数据 ;参考书目

文档评论(0)

gm8099 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档