两阶段抽样.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
两阶段抽样

两 阶 段 抽 样 班级: 学号: 姓名: 山东省1999年市县人口多阶段抽样分析 数据来源: 利用山东省1999年市县人口统计数据(见附表),得到山东省17个地级市(160个县级市)及各个地级市中各县级市的人口数量。其中济南有11个县级市,青岛有13个县级市,淄博有9个,枣庄有7个 东营有6个 烟台有13个,潍坊有13个,济宁有13个,泰安有7个,威海有5个,日照有4个,莱芜有3个, 临沂有13个,德州有12个,聊城有9个, 滨州有7个,菏泽有9个。 综上, ,的取值见下表 地级市 济南 青岛 淄博 枣庄 东营 地级市 烟台 潍坊 济宁 泰安 威海 地级市 日照 莱芜 临沂 德州 聊城 地级市 滨州 菏泽 问题: 利用两阶段抽样,抽样方法(1)第一阶段和第二阶段都按简单随机抽样抽取,(2)第一阶段采用简单随机抽样,第二阶段采用分层抽样。(3)分层两阶段抽样,即第一阶段从各层中按简单随机抽样抽取个初级单元,第二阶段从初级单元中等概率抽取个基本单元。 试确定三种种抽样方法第一阶段和第二阶段抽取的样本量各为多少,估计三种抽样方法下总体均值、总体均值的方差,给出95%的置信区间,并比较两种方法下估计量的精度和性质。 抽样方案: 1.两阶段均按简单随机抽样抽取 (1)样本量的确定 第一阶段的样本量:按简单随机抽样确定样本量,其中.对于该题,,,,;经计算第一阶段抽取的样本量约为。利用Matlab软件得到随机数(程序见附录1),抽取的4枣庄、5东营、7潍坊、11日照、16滨州。 第二阶段样本量:对于抽取的初级单元,再分别确定次级单元样本量。与上述做法相同(程序见附录),枣庄(市辖区2008370,薛城区449084,山亭区453739),(市辖区735187,东营区 547119,河口区188068,垦利县211444,利津县289593,广饶县 470198),(寒亭区352481,寿光市1051059,奎文区344011,昌邑市684434,高密市845140),(市辖区 1146157 东港区1146157,五莲县511558 ,莒县 1095609),(滨州市593315,惠民县620335,沾化县381146) (2)总体均值的估计 两阶段都采用简单随机抽样,且每个初几单元中的二级单元都是独立的,对总体均值的估计采用简单平均估计:,其中。由上述数据得。而,因此该估计是有偏的,根据所得数据。 此外该估计的方差为:,其中,,,,,,,,,,,.解得,标准差,那么该抽样方法下均值估计的95%置信区间为[270117,976802]。 2.第一阶段按简单随机抽样,第二阶段按分层抽样 (1)样本量的确定 第一阶段样本量沿用第一种方法的样本量,即抽取5个初级单元分别为枣庄、东营、潍坊、日照、滨州。 第二阶段的样本量与第一种方案相同,但要事先用SPSS将各个初级单元中的次级单元分层(分层结果见附录2)。从各层中抽取次级单元枣庄(市辖区2008370峄城区348430 滕州市 1549627),(市辖区735187,东营区547119 河口区188068,垦利县211444,利津县289593,广饶县 470198),(市辖区 1306056 奎文区 344011 寿光市 1051059 昌邑市 684434高密市 845140),(市辖区 1146157 东港区1146157,五莲县511558 ,莒县 1095609),(滨州市 593315沾化县 381146邹平县 684079) (2)总体均值的估计 对总体均值的估计采用简单平均估计:,其中。由上述数据得。 为总体均值方差的估计,其中..,,,, ,,,,,,.解得,标准差,那么该抽样方法下均值估计的95%置信区间为[653226,709256]。 3. 分层两阶段抽样 (1)样本量的确定 第一阶段从各层中按简单随机抽样抽取个初级单元,第二阶段从初级单元中等概率抽取个基本单元。首先要将所给数据的初级单元分层(分层结果见附录三),为计算简便,将初级单元分三层从中随机各抽取1个。即,利用matalab抽取了潍坊、东营和济南。第二阶段都从初级单元中抽取三个,济南抽取(市辖区、历城区、历下区)东营抽取(市辖区、东营区和利津区) (2)总体均值的估计 该总体共有17个初级单元,共分为三层,第一层上有6个初级单元,第二层上有6个初级单元,第三层上有5个初级单元。则总体均值的分层二阶估计量为,其中,。利用所给数据得。 此外该总体均值方差的估计为:,其中,分别为,,;,分别为,,; ,,;,,。解得,标准差,那么该抽样方法下均值估计的95%置信区间为[648308.4,707080.6]。

您可能关注的文档

文档评论(0)

gangshou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档