统计学统计描述.pptxVIP

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

统计学统计描述

CONTENCT

统计描述基本概念

曼-惠特尼U检验

相关性分析

卡方分布与秩相关系数

学生t检验与LSD方法

回归分析在统计描述中应用

总结与展望

统计描述基本概念

统计描述定义

统计描述目的

统计描述是统计学中用于整理和描述数据的基本方法,通过对数据的收集、整理、展示和解释,以揭示数据分布规律和特征。

统计描述的主要目的是使数据更加易于理解和分析,通过图表、图形和数字等方式展示数据,帮助研究者更好地把握数据的整体情况和内在联系。

定量数据

定量数据是具有数值特征的数据,如身高、体重等。定量数据可分为离散型和连续型两种,离散型数据是可数的整数或自然数,而连续型数据则是实数范围内可取的任何值。

定性数据

定性数据是描述事物属性或特征的数据,如性别、职业等。定性数据可分为有序和无序两种,有序定性数据具有明确的等级或顺序关系,而无序定性数据则没有。

均值

中位数

众数

方差与标准差

均值是一组数据的算术平均数,用于描述数据的集中趋势。均值适用于定量数据,特别是连续型数据。

中位数是一组数据按大小顺序排列后位于中间位置的数,用于描述数据的集中趋势。中位数适用于各种类型的数据,特别是存在极端值或异常值时。

众数是一组数据中出现次数最多的数,用于描述数据的集中趋势。众数适用于各种类型的数据,特别是离散型数据。

方差是各数据与均值之差的平方的平均数,用于描述数据的离散程度;标准差是方差的算术平方根,也用于描述数据的离散程度。方差和标准差适用于定量数据,特别是连续型数据。

曼-惠特尼U检验

曼-惠特尼U检验是一种非参数检验方法,用于比较两个独立样本的差异。

该检验基于秩和的概念,通过对样本数据排序并分配秩次,计算两组样本的秩和,进而判断两组样本是否存在显著差异。

曼-惠特尼U检验不要求数据服从正态分布,适用于连续型和等级型数据。

提出假设

计算秩次

计算秩和

计算U值

判断显著性

设定原假设和备择假设,原假设通常为两组样本分布相同。

将两组样本混合后按大小排序,并分配秩次。

分别计算两组样本的秩和。

根据样本量和秩和计算曼-惠特尼U值。

将计算得到的U值与临界值进行比较,判断结果的显著性。

01

02

03

04

实例

数据收集

数据分析

结果解读

应用曼-惠特尼U检验对两组数据进行比较。

收集两组患者的病情改善数据。

比较两组不同治疗方法对患者病情改善的效果。

如果U值小于临界值,则拒绝原假设,认为两种治疗方法的效果存在显著差异;否则,接受原假设,认为两种治疗方法的效果无显著差异。

相关性分析

指两个或多个变量之间的关系,当一个变量变化时,另一个变量也随之变化。

相关性概念

包括正相关、负相关和无相关。正相关表示一个变量增加时,另一个变量也增加;负相关表示一个变量增加时,另一个变量减少;无相关表示两个变量之间没有线性关系。

相关性类型

皮尔逊积矩相关系数定义

衡量两个变量之间线性相关程度的统计量,取值范围在-1到1之间。

计算步骤

首先收集两个变量的数据,然后计算每个变量的均值和标准差,接着计算皮尔逊积矩相关系数,最后根据计算结果判断相关性的方向和强度。

卡方分布与秩相关系数

卡方分布是由正态分布衍生出来的一种概率分布,用于描述多个独立标准正态分布变量的平方和的概率分布。

原理

卡方分布具有可加性,即若两个独立的随机变量分别服从自由度为n1和n2的卡方分布,则它们的和服从自由度为n1+n2的卡方分布。

性质

计算

秩相关系数是用于衡量两个变量之间等级相关程度的统计量。常用的秩相关系数有Spearman秩相关系数和Kendall秩相关系数。计算步骤包括对数据排序、确定等级、计算等级差、代入公式计算等。

意义

秩相关系数能够反映两个变量之间的单调关系,即当一个变量增加时,另一个变量也倾向于增加或减少的趋势。与线性相关系数相比,秩相关系数对异常值和离群点不敏感,因此更加稳健。

假设我们有一组数据,包含两个变量X和Y的观测值。我们可以通过计算Spearman秩相关系数或Kendall秩相关系数来评估X和Y之间的等级相关程度。

实例

根据计算得到的秩相关系数值,我们可以判断X和Y之间是否存在显著的等级相关关系。如果秩相关系数接近1或-1,表示X和Y之间存在强烈的正相关或负相关关系;如果秩相关系数接近0,则表示X和Y之间没有明显的等级相关关系。同时,我们还可以结合显著性检验来判断这种相关关系是否具有统计意义。

解读

学生t检验与LSD方法

原理

3.计算检验统计量

4.确定p值

5.作出决策

2.选择检验类型

1.提出假设

学生t检验是一种用于比较两组样本均值是否有显著差异的统计方法。它基于t分布,通过计算t统计量并查表得到相应的p值,从而判断两组数据是否存在显著差异。

确定原假设和备择假设,通常原假设为两组样本均值

文档评论(0)

微传科技 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体唐山市微传科技有限公司
IP属地河北
统一社会信用代码/组织机构代码
91130281MA0DTHX11W

1亿VIP精品文档

相关文档