- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言统计第三章 集中趋势与集中量数
第三章集中趋势与集中量数 第一节 平均数算术 1.平均数 2.加权平均数 第二节 中数 第三节众数 1.测量水平 2.灵敏程度 3.稳定程度 4.信息容量 5.代数运算 6.极端数值 7.数据分布 第一节 平均数 平均数有算术平均数、集合平均数、加权平均数等几种。由于算术平均数最为常用,因此在没有引起误解的情况下,通常用“平均数”来指算术平均数。 算术平均数 算术平均数或平均数,一般用符号 ( 读作“X杠”,表示平均数是由变量X计算而来)或M表示。 算术平均数的计算有以下几种情况: 1.根据未分组数据计算平均数 方法是:把数据中的所有数值累加,在初一数值的个数。用公式表示如下 2.根据次数分布表球平均值 不难看出,直接用原始数据计算平均数很费时间,当数据量很大时尤其如此。其实,上足数据中有很多数值时重复出现的,因此我们可以把每个数值与其出现的次数相乘(没有重复的数值则乘1,结果即该数值本身),然后再累加,最后初一总次数(数值的个数)、就能得到平均数。这一方法显然要简捷一些。用公式表达如下: 3.根据分组次数分布表计算平均数 此外,还可以利用分组次数分布表计算数据的算术平方数。方法是:先用每组的组中点乘以该组的次数,求出各组内数值的和,然后把各组的和相加,得出总和,最后初一总次数(即数值的个数)。用公式表示为: 加权平均数 在计算算术平均数时,是把一组数值累加,再除以熟知的个数。这时,各熟知的重要性是一样的。如果要赋予各数值以不同的重要性,就要用不同的方法计算平均数,这就是加权平均数(用符号Mw表示)。这里的“权”(或“权数”、“权重”)就反映了熟知的相对重要性。其实,“权”的概念对于我们并不陌生,譬如,在一份试卷中,我们给不同的题目分配不同的分值,就是要以此来体现不同题目的难度、重要性等;在目前的高考中,在计算总分时,并不是每一门课满分都是100分,二十有底是100分,有底是50分等等。这也是给不同的科目以不同的“权”。 计算加权平均数的公式是 该公式表示:把每一个数值乘以其权数,累加,然后除以各数值的权数之和。 第二节 中数 中数,又称中位数,用符号Md或Mdn表示,是集中数量的一种。假如把一组数值从高到底或从低到高排序,畏惧中间的那个数值就是中数,它把一组数值恰好分成两等分,一半位其上,一半居其下。如果用分布图来表示数据段分布,则通过中输掉一条垂线敲好把分布图中的面积分成两个相等的部分。 1.从未分组数据求中数 从未分组数据求中数时,把数据按大小排序,然后找出中间的那个数值即可。如果数值的个数(N)为奇数,位于正中间的那个数值,即(N+1)/2那个数,就是中数。例如在下面一组数据中有7个数值,中数就是第(7+1)/2那个数,也就是第四个数,即5: 1,3,4,5,8,9,12 (N=7,Md=5) 当数值的个数为偶数时,则用第N/2与第N/2+1两个数值的平均数作为中数,例如在下列有10个数值(N=10)的数据中,第N/2个数值(即第五个数)是12,第N/2+1个数值(即第六个数)为16,因而中数为 (12+16)/2=14 3,6,9,10,12,16,17,18,20 (N=10,Md=14) 从上例可以看出,中数有时是原数据中的数值,而有时则可能不是。 2.从分组次数分布表求中数依次数分布而言,中数应位于总次数(N)的50%这一点上。其计算公式如下 第三节众数 众数也是反映集中趋势的一个量数,常用符号Mo表示。众数就是在一组数据中出现次数最多的那个数值,例如在6,3,4,4,7,3,4这组数据中,4这个数值出现的次数最多,因而改组数据的众数就是4。 但是有时也会出现一些特殊情况。例如当各数值出现的次数完全一样时,该组数据就没有众数,而有时则会出现两个以上的众数。含有两个众数的次数分布称为双众数分布。 众数的求法如下:对于量小的数据,通过直接观察就可以找到众数;对于量较大的数据,可以先按照大小排序,这样观察起来方便一些;对于量非常大的数据,最好的办法就是先把数据整理成次数分布表(或用次数分布图表示),这时众数就一目了然了。 除此以外,我们还可以利用公式(皮尔逊经验公式)求众数的近似值 Mo=3Md-2M 式中 Mo——众数; Md——中数; M——平均数。 第四节 平均数、中数与众数的比较与选择 我们已经讨论了反映数据集中趋势或典型情况的三个最基本的量数:平均数、中数与众数,但是由于各自的性质与特点,它们在特点情况下的适用性是不同的,因而有必要把它们加以比较,以利于在统计时间中作出正确的选择。 1.测量水平 变量的测量水平是选择代表值时需要考虑的重要因素之一。对于等距变量和比率变量,这三个集中量数都可以使用;对于顺序变量中数更为合适,因为中数是建
文档评论(0)