- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数学建模MathematicalModeling
数据统计描述与分布Statisticaldescriptionanddistributionofdata
数据统计分布的重要性及分类01
一、数据统计分布的重要性及分类问题:如何利用统计的方法来描述这些数据的统计分布规律?数据统计结果随处可见吸烟对健康是有害的,吸香烟的男性平均寿命减少寿命2250天不结婚的男性会平均寿命减少寿命3500天身体超重30%会使平均寿命寿命减少1300天每天摄取500毫升维生素C平均寿命可延长6年身材高的父亲,其子女的身材一般也较高笫二个出生的子女一般没有笫一个聪明
一、数据统计分布的重要性及分类按照数据来源分类表格数据:关系记录,数据矩阵,向量,事物数据图和网络:万维网,社交网络,分子结构多媒体数据:文本,图像,视频,音频按照数值变量分类连续型:特征可以在实数空间任意取值,如温度、身高、长度、价格等,通常由浮点型表示离散型:其值域为有限集或可列集,若一个集合与自然数集合之间存在一一对应关系,则这个集合称为可列集。如汽车品牌、NBA球队等布尔型、等级型、名义型。
数据的概括性度量02
二、数据的概括性度量均值也称为平均数,是一组数据相加后除以数据个数得到的结果。均值?
?意义:平均数是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分。平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准。二、数据的概括性度量均值
?意义:中位数作为一组数据的代表,可靠性较差,因为它只利用了部分数据。但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。二、数据的概括性度量中位数
众数是数据中出现频率最高的数据。一般情况下,只有在数据量较大的情况下,众数才有意义。意义:众数作为一组数据的代表,可靠性也较差,因为它只利用了部分数据。在一组数据中,若个别数据变动很大,且某个数据出现的次数最多,此时用该数据表示这组数据的“集中趋势”就比较适合。二、数据的概括性度量众数
方差二、数据的概括性度量?意义:方差是测算离散趋势最重要、最常用的指标之一。当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
?数据距离二、数据的概括性度量?
?数据距离二、数据的概括性度量?
分布函数03
三、分布函数离散型概率分布——伯努利分布应用:例如抛一次均匀硬币的结果只有正面和反面;特定机器生产的零件的是有缺陷的还是无缺陷的等。?
#可进行1次实验,其中分别中成功的概率k=np.arange(0,2)n=1#独立实验次数p=0.3#每次事件成功的概率#计算概率分布律binomial=binom.pmf(k,n,p)三、分布函数用python产生拟合伯努利分布
?应用:例如保险公司可以利用二项分布算出公司获利、亏本的各种情形,以保证公司业务量与利润达到一定要求;在生产活动中利用二项分布算出至少需配备多少工人,才能保证设备发生故障但不能及时维修的概率小于0.01等三、分布函数离散型概率分布——二项分布
#可进行0-10次实验,其中分别中成功的概率k=np.arange(0,11)n=10#独立实验次数p=0.3#每次事件成功的概率#计算概率分布律binomial=binom.pmf(k,n,p)图2三、分布函数用python产生拟合二项分布
?三、分布函数离散型概率分布——泊松分布应用:例如一定时间段内,某航空公司接到的订票电话数;一定时间内,到车站等候公共汽车的人数;一定路段内,路面出现损坏的次数;一匹布上发现的疵点个数;一定页数的书刊上出现的错别字个数等等。?
?图3三、分布函数用python产生拟合泊松分布
?离散型概率分布——超几何分布应用:例如在产品质量检验的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数用超几何分布解决;在购买股票时有N只股票,其中有M只是获利的,若购买n只股票,其获利股的数量可用超几何分布解决。三、分布函数
N=10#总体中元素个数为10M=3#总体中代表成功元素的个数为3n=4#试验4次K=3#试验成功了3次y=stats.hypergeom.pmf(K,M,n,N)#计算概率图4三、分布函数用python产生拟合超几何分布
?应用:正态分布可以应用在某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布。三、分布函数连续型分布函数——正态分布
文档评论(0)