网站大量收购独家精品文档,联系QQ:2885784924

DMAIC_Training_Analyze__个人讲义.docx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DMAIC_Training_Analyze__个人讲义

Phase II Analyze 2012.07.06 -- 07回顾:流程图帮助我们来找到X; 因果矩阵帮我们来减少X的数量,由几十个减少为5-10个,然后使用数据验证这些X对Y的影响.然后讲到数据本身来源要精确,这样MSA来帮助我们看数据来源是否准确.还有一个就是Capability,或者西格玛水平,用一个客观的方式来衡量改进前后的比较.数据分析的话,主要是根据X,Y变量的数据类型选择指示矩阵中的方法. 单一X 多数X X Data 离散X Data连续 X Data 离散X Data连续单一YY Data离散Chi-Square(卡方检验)Logistic Regression(逻辑回归) Multipile Logistic RegressionMultipile Logistic RegressionY Data 连续ANOVA(方差分析) Means/Medians Tests(t检验,Box plot)Regression 2,3,4 way AnovaMedians testsMultipile Regression多数YsMultivariate Analysis(Note:This is not Multi-Vari Studies)第1章卡方检验(X离散,Y离散,且都是一个变量)举例说明问题来源:人事部想了解年龄(old/young)与受聘之间的关联性.这里的Y是录用或者不录用,为离散数据类型;而X为Old/Young,也是离散的.或者是 Hire Not HireMail 50 100Female 25 50 24 51 23 52 ? ?这个差距到多少(数据为多少)我们认为差别大,就是说受聘与性别有关系?这里先提到一个假设检验:在Chi-Square独立性检验中,统计学家对大多数的变量皆假设为独立的,因此:H0:资料相互独立 (不相关)Ha:资料相互不独立 (相关)如果P值0.05,就拒绝H0.同时我们使用的所有软件假设录用不录用不受年龄影响,软件先定下原假设的结论就是默认无影响,原假设的P值0.9, 90%的可能性没有影响; p=0.1,10%的可能性没有影响,感觉上10%已经很小了,但是如果怀疑有影响,必须有足够的证据来证明有影响;因此我们觉得还是不够,只有到P值0.05,我们才觉得有足够的证据来拒绝原假设(不受影响),来说明有影响.也就是会所从保守(普通)的角度来考虑问题.这样我们想要知道年龄与受聘间是否独立假设如下:H0:年龄与受聘间是独立的(不相关)Ha:年龄与受聘间是不独立的(相关的)步骤1:把两个变量分成不同的level,并制作Observed Frequency Table (观察频率表):年龄: Old Young聘雇: Hired Not Hired, 然后收集数据资料并分析Hire Not Hire Mail 30 150Female 45 230步骤2:计算栏与列的总合步骤3:制作Expected frequency table (期望频率表),也就是说,如果这两个变量相互独立,表格应该是什么样的?下表右上步骤4:将实际观察值(Observed)减去期望值 / (Observed - Expected),上图右下.步骤5:将其差(O-E)平方,参考下左步骤6:计算相对的平方差(squared difference) = (O-E)^2/E,得到上右.用公式得到数值比0.005精确,把这四个数相加得到:Chi-squared = 0.0037+0.00074+0.0024+0.00048 = 0.0073.相对平方差之和为Chi Square分布.这里自由度 = (行数-1)x(列数-1) = (2-1)x(2-1)=1,也就是说这个分布是自由度为1的卡方分布,一旦自由度定下来,那么这个图形的胖瘦形状就定下来(注意任何自由度的卡方分布都是以0为起点).卡方值为0.0073右边的面积为P值, X轴为卡方值.面积的计算公式为=CHIDIST(卡方值,1), [注意这里1为自由度].得到面积为0.93, P=0.930.05,无法拒绝原假设,那就是独立(不相关).如果使用Excel来计算,方法如下:(参考Excel, Analyze.xls sheet “Chi-square”)如果更改一个数值,观察,参考Analyze sheet “eg1”得到0.000002, P0.05,则拒绝原假设,两者不独立,相关.分析的Roadmap如下:如果多一个X,则自由度会变化,其他还是类似:三个检验员, Walt为专职检验员, W

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档