统计学(第8版) 何晓群-(02)第2章 数据的搜集.pptxVIP

统计学(第8版) 何晓群-(02)第2章 数据的搜集.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作者:贾俊平 2023-4-18 2023-4-18 统 计 学 (教学用-ppt) 首届全国教材建设奖全国优秀教材(高等教育类) “十二五”普通高等教育本科国家级规划教材 国家统计局优秀统计教材 21世纪统计学系列教材 贾俊平 2023-4-18 2.1 数据的来源 2.2 调查方法 2.3 实验方法 2.4 数据的误差 第 2 章 数据的搜集 导 读 2016年轰动全球的重大事件之一是美国民调机构总统大选预测的失手。舆论普遍预测民主党的希拉里将在这次大选中获胜,但投票结果令人大跌眼镜,共和党的特朗普出人意料地成为第58届美国总统,舆论一片哗然。 美国总统大选预测是有历史的,该预测采用抽样调查的方法,在选民中抽取少量人作为样本,根据样本调查结果对总体进行推断。被称为民意调查创始人的乔治·盖洛普(George Gallup)是美国舆论统计学家,1935年创建美国民意调查研究所,开始正式进行各类全国性民意调查。在1936年美国大选中,另一个著名机构“文艺文摘”宣称根据它对240万选民的调查,共和党候选人兰登将会当选,而盖洛普公司基于对5万选民的调查,预测民主党候选人罗斯福将获胜。事实证明盖洛普公司的预测正确,样本量5万比样本量240万的预测还要准确,从此盖洛普公司名声大振,由此也催生和带动了美国的民意调查和市场调查业的发展。近几十年来盖洛普公司对美国总统大选的预测无一失手,大选预测的许多材料成为统计学课程中的经典案例。 但2016年美国总统选举结果却狠狠地打了民调机构的脸。这次民调机构普遍预测希拉里将胜出,美国将出现历史上第一位女总统。但选举结果着实出人意料,是什么原因导致总统竞选预测结果的失败? 美国民调机构2016年总统大选预测的失手 导 读 调查专家们进行了总结和反思。其实,就最后选票看,希拉里普选票高于特朗普票数近300万,但美国总统非直接民选,而是由各州依人口比例委任选举人团代表选出。获得一州相对多数选票的候选人,其所属政党可推选该州所有的选举人团代表。此方法意味着,如果哪位总统候选人在州获得多数票,该州的选举人团票就基本上属于这位总统候选人。这样,希拉里和特朗普的决斗胜负就取决于几个摇摆的州,希拉里只要在其中一二个州胜出就可获得最后胜利。但命运却偏偏眷顾特朗普。媒体说,投票结果公布后,奥巴马政府情报部门进行了调查,发现有国外因素涉入,某国的“黑客”在投票前公布了一些不利于希拉里的绝密文件,影响了最后投票的走势。特朗 普最后也被迫承认“黑客门”的信息对自己有利,但反驳说外部势力没有也不可能改动选票。除了这个因素,分析还认为,有人查阅了网站竞选预测指针的源代码,发现其变化并非来自实时数据,而是呈现随机摇摆,由此推测样本点的分布不够均匀。调查中的缺失数据和失真数据是一个重要原因,数据分析表明,许多特朗普的支持者在调查中或者保持沉默,或者说了假话,对统计推断产生了误导。上述分析表明,预测失败不是因为抽样技术和统计推断不科学,而是因为偏离了正确的抽样,调查数据存在虚假,推断中没有考虑关键的影响变量 美国民调机构2016年总统大选预测的失手 2.1 数据的来源 二手数据的来源 统计部门和政府部门公布的有关资料,如各类统计年鉴 各类经济信息中心、信息咨询机构、专业调查机构等提供的数据 各类专业期刊、报纸、书籍所提供的资料 各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料 从互联网或图书馆查阅到的相关资料 业务资料,如与业务经营活动有关的各种单据,记录 经营活动过程中的各种统计报表 各种财务,会计核算和分析资料等 数据的间接来源 二手数据的特点 搜集容易,采集成本低 作用广泛 分析所要研究的问题 提供研究问题的背景 帮助研究者更好地定义问题 检验和回答某些疑问和假设 寻找研究问题的思路和途径 搜集二手资料在研究中应优先考虑 二手数据的评估 数据是谁搜集的? 可信度评估 为什么目的而搜集的? 数据是怎样搜集的? 什么时候搜集的 2.1 数据的来源 调查数据 通过调查方法获得的数据 通常是对社会现象而言 通常取自有限总体 实验数据 通过实验方法得到的数据 通常是对自然现象而言 也被广泛运用到社会科学中 如心理学、教育学、社会学、经济学、管理学等 数据的直接来源 2.2 调查方法 概率抽样 也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率 概率抽样和非概率抽样——概率抽样 简单随机抽样 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的 最基本的抽样方法,是其

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档