- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异
项目数据分析师 ---- T检验、F检验和统计意义以及显著性差异 1、T检验和F检验的由来
一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统
计学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道多少%的机会下会得到目前的结果。倘若经比较后发
现,出现这结果的几率很少,亦即是说,实在机会很少,很罕有的情况下才出现,那我们便
可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝
虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的几率很高,并不罕见;那我
们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的几率。
2、统计学意义(P值或sig值)
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联式总体中各变量关
联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我
们重复类似实验,会发现约20个试验中有一个实验,我们所研究的变量关联将等于或强于
我们的实验结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学
效力有关。)在许多研究领域,0.05的p值通常被认为是可以接受错误的边界水平。 3、T检验和F检验
至于具体要坚定地内容,须看你是在做哪一个统计程序。
举一个例子,比如,你要检验两独立样本均数差异是否能推论总体,而进行的t检验,两样本(如:某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,
代表总体的情况也是存在显著差异呢?
会不会总体中男女生根本没有差别,只不过是你那么巧抽到这两个样本的数值不同? 为此,我们进行t检验,算出一个t检验值。与统计学家建立的以“总体中没差别”作为基
础的随机变量t分布进行比较,看看在多少百分比的机会(亦即显著性sig值)下会得到目前的结果。
若显著性sig值很少,比如《0.05小于5%几率》,亦即说是,“如果”总体“真的”没有差
别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还
是有5%机会出错,但我们还是可以“比较有信心”的说:目前样本中这情况(男女生出现
差异的情况)不是巧合,是具统计学意义的,“总体中男女生不存差异”的虚无假设应予拒
绝,简言之,总体应该存在显著差异。
每一种统计方法的检定的内容都不相同,同样是t检验,可能是上述的检定总体中是否存在
差异,也同能是检定总体中的单一值是否等于0或者等于某一个数值。 至于F检验,方差分析(或变异系数分析,Analysis of Variance),它的原理大致也是上面说
的,但他是透过检视变量的方差而进行的。它主要用于:均数拆别的显著性检验、分离各有
关因素并估计期对总变异的作用,分析因素间的交互作用,方差齐性(Equality of Variances)检验等情况。
文档评论(0)