- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二讲描述统计
第二章 多元描述统计分析 Chernoff于1973年提出了用二维平面的脸来表示p维观测结果,脸的特征(如脸的形状、嘴的弯曲度、鼻子的长度、眼睛的大小、瞳孔的位置等)是由p个变量的值所决定的。 按照最初的设计, Chernoff Faces可处理18个变量,脸部容貌对应的变量的分配可以由实验者自己完成,不同的选择会产生不同的结果。 根据各指标的数值就可以勾画出一个人的脸谱,利用这些脸谱的差异就反应了所对应的样本之间的差异特征,利用脸谱图的直观性,可以给我们的数据分析带来很大的方便。 用EXCEL绘制轮廓图如下 脸谱图Chernoff Faces切尔诺夫脸 人们的反应表现在脸上。 脸谱图Chernoff Faces切尔诺夫脸 1970年由切尔诺夫提出。 Chernoff suggested use of faces to encode a variety of variables - can map to size, shape, colour of facial features - human brain rapidly recognises faces Chernoff Faces Here are some of the facial features you can use 脸的范围 脸的形状 …… /software/faces.html * * 统计规律(一些例子) 1、正常条件下新生婴儿的性别比为107:100 2、投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6 3、农作物的产量与施肥量之间存在相关关系 统计方法 统计方法 描述统计 推断统计 参数估计 假设检验 。 研究如何通过样本数据去推断总体数量特征。是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。 统计学 描述统计学 推断统计学 研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征 描述统计与推断统计的关系 反映客观现象的数据 总体内在的数量规律性 推断统计 (利用样本信息和概率论对总体的数量特征进行估计和检验等) 概率论 (包括分布理论、大数定律和中心极限定理等) 描述统计 (统计数据的搜集、整理、显示和分析等) 总体数据 样本数据 统计学探索客观现象数量规律性的过程 统计中的几个基本概念 总体和样本 参数和统计量 变量 总体和样本 1、总体(population) 所研究的全部元素的集合 ,其中的每一个元素称为个体 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的 2、样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量 参数和统计量 1、参数(parameter) 研究者想要了解的总体的某种特征值 所关心的参数主要有总体均值(?)、标准差(?)等 总体参数通常用希腊字母表示 2、统计量(statistic) 根据样本数据计算出来的一个量 所关心的样本统计量有样本均值(?x)、样本标准差(s)等 样本统计量通常用小写英文字母来表示 统计中的几个基本概念 平均数 标准差 比例 参数 ? ? ? 统计量 ?x s p ? ? ? ? ? ? ? ? 总体 ? ? ? 样本 变 量 (Variable) 1、说明现象某种特征的概念 如商品销售额、受教育程度、产品的质量等级等 变量的具体表现称为变量值,即数据 2、变量可以分为 分类变量(categorical variable) :说明事物类别的一个名称 顺序变量(rank variable ) :说明事物有序类别的一个名称 数值型变量(metric variable ) :说明事物数字特征的一个名称 离散变量:取有限个值 连续变量:可以取无穷多个值 关于多元数据 一、多元描述统计量 数据的组织 用数据矩阵形式组织多元数据,有利于对数据 的变换、处理和计算 。 数据的描述统计量 p个变量的样本协方差阵为 样本相关系数阵 定义两个变量间的样本相关系数为 j=1,2,…,p,k=1,2,…,p 样本相关系数阵: 二、多元数据的图形表示 不同变量的散点图 主要考虑受教育年限(educ), 工资水平(salary), 初始工资水平(salbegin), 工作时间(jobtime)四个变 量之间的相关关系。 运用SPSS可绘制左图: 多维箱线图 箱线图(Boxplot),又称箱须图(Box-whisker Plot),是利用数据中的五个统计量(最小值、
文档评论(0)