- 1、本文档共76页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
B数据的统计与分析剖析
主讲: 黄红星 邮箱:hhx825@126.com 博客:/u/hhx825/ ( Google:黄红星 ) 数据的统计与分析的两类方法 1. 数据的整理和描述 数据的收集和样本的概念 数据的整理、频数表和直方图 统计量 MATLAB命令 数据的收集 样本:统计研究的主要对象 总体--研究对象的全体。如所有顾客感觉舒适的高度 个体--总体中一个基本单位。如一位顾客的舒适高度 样本--若干个体的集合。如50位顾客的舒适高度 样本容量--样本中个体数。如50 数据的整理 比较直观,比较清晰的结论 21—50岁的中青年患者大约占总发病人数的 3/4,提醒民众中青年是易感人群。 频数表 平均值 标准差 统计量 示例 2. 随机变量的概率分布及数字特征 频率与概率 概率密度与分布函数 期望和方差 常用的概率分布 MATLAB命令 频率与概率 概率密度与分布函数 期望和方差 常用的概率分布 常用的概率分布 点估计 点估计的评价标准 区间估计——总体均值和总体方差 参数估计的MATLAB实现 4、假设检验 总体均值的假设检验 总体方差的假设检验 两总体的假设检验 0-1分布总体均值的假设检验 总体分布正态性检验 假设检验的MATLAB实现 假设检验的MATLAB实现 MATLAB命令使用说明 示例:吸烟对血压有影响吗? 示例:如何制定汽油供货合同? 用N(5,1)随机数产生n=100的样本,在总体方差未知的情况下分别取?=0.05和?=0.01检验总体均值? ?5.2。 x = normrnd(5,1,100,1); m = mean(x), [h1,sig1,ci1] = ttest(x,5.2,0.05,-1) [h2,sig2,ci2] = ttest(x,5.2,0.01,-1) m = 5.0111, [h1,sig1,ci1] = 1 0.0343 -Inf 5.1815 [h2,sig2,ci2] = 0 0.0343 -Inf 5.2537 可知在?=0.05下拒绝H0(此时sig1?),?的区间估计(-? 5.1815]不包含5.2;而在?=0.01下接受H0(此时sig2?),?的区间估计(-? 5.2537]包含5.2。 计算结果 Exam1102.m Exam1101.m 对吸烟和不吸烟两组人群进行24小时动态监测,吸烟组66人,不吸烟组62人,分别测量24小时收缩压(24hSBP)和舒张压(24hDBP),白天(6Am-10Pm)收缩压(dSBP)和舒张压(dDBP ), 夜间(10Pm-6Am)收缩压(nSBP)和舒张压(nDBP)。然后分别计算每类的样本均值和标准差 7.03 65.84 8.60 69.35 nDBP(mmHg) 10.11 107.10 10.78 109.95 nSBP(mmHg) 6.80 75.44 8.75 79.52 dDBP(mmHg) 8.71 117.60 11.36 122.70 dSBP(mmHg) 6.20 72.87 8.45 76.83 24hDBP(mmHg) 8.28 114.79 10.77 119.35 24hSBP(mmHg) 不吸烟组标准差 不吸烟组均值 吸烟组标准差 吸烟组均值 问题: 1)任何一个考察的时段,吸烟和不吸烟群体的血压的真值分别是多少?(参数估计) 2)吸烟和不吸烟群体的血压的真值是否有区别?(假设检验) 当二项分布的n??,np??(常数)时 泊松分布(Poisson distribution) X~Poiss(?), 背景问题: 服务系统在一定时间内接到的呼唤数(到达率) 常用的概率分布:离散分布 MATLAB命令 poiss bino f t chi2 norm exp unif 字符 泊松分布 二项分布 F分布 t分布 分布 正态分布 指数分布 均匀分布 分布 rnd stat inv cdf pdf 字符 随机数生成 均值与方差 逆概率分布 分布函数 概率密度 功能 y=normpdf(1.5,1,2) 正态分布(?=1, ?=2) 在x=1.5处的概率密度(标准正态分布的?, ? 可省略) y=normcdf([-1 0 1.5],0,2) 在 x= -1, 0, 1.5处分布函数值 [m,v]=fstat(3,5) 计算F(3,5)的期望和方差 x=tinv(0.3,10) 计算t(10)的0.3-分位数 二维正态分布 二维随机变量 二维随机变量 联合分布密度函数 边际分布密度函数 协方差 相关系数 二维随机变量: MATLAB命令 cov(x,y)
文档评论(0)