项目数据分析师----T检验、F检验和统计意义以及显著性差异.doc

项目数据分析师----T检验、F检验和统计意义以及显著性差异.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异 项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异 1、T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统 计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道多少%的机会下会得到目前的结果。倘若经比较后发 现,出现这结果的几率很少,亦即是说,实在机会很少,很罕有的情况下才出现,那我们便 可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝 虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的几率很高,并不罕见;那我 们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的几率。 2、统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联式总体中各变量关 联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我 们重复类似实验,会发现约20个试验中有一个实验,我们所研究的变量关联将等于或强于 我们的实验结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学 效力有关。)在许多研究领域,0.05的p值通常被认为是可以接受错误的边界水平。 3、T检验和F检验 至于具体要坚定地内容,须看你是在做哪一个统计程序。 举一个例子,比如,你要检验两独立样本均数差异是否能推论总体,而进行的t检验,两样本(如:某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体, 代表总体的情况也是存在显著差异呢? 会不会总体中男女生根本没有差别,只不过是你那么巧抽到这两个样本的数值不同? 为此,我们进行t检验,算出一个t检验值。与统计学家建立的以“总体中没差别”作为基 础的随机变量t分布进行比较,看看在多少百分比的机会(亦即显著性sig值)下会得到目前的结果。 若显著性sig值很少,比如《0.05小于5%几率》,亦即说是,“如果”总体“真的”没有差 别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还 是有5%机会出错,但我们还是可以“比较有信心”的说:目前样本中这情况(男女生出现 差异的情况)不是巧合,是具统计学意义的,“总体中男女生不存差异”的虚无假设应予拒 绝,简言之,总体应该存在显著差异。 每一种统计方法的检定的内容都不相同,同样是t检验,可能是上述的检定总体中是否存在 差异,也同能是检定总体中的单一值是否等于0或者等于某一个数值。 至于F检验,方差分析(或变异系数分析,Analysis of Variance),它的原理大致也是上面说 的,但他是透过检视变量的方差而进行的。它主要用于:均数拆别的显著性检验、分离各有 关因素并估计期对总变异的作用,分析因素间的交互作用,方差齐性(Equality of Variances)检验等情况。

文档评论(0)

Kumba + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档