真理在缩水,还是上帝在掷骰子?——对定理的理解.pdfVIP

真理在缩水,还是上帝在掷骰子?——对定理的理解.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
真理在缩水,还是上帝在掷骰子?——对定理的理解

谢益辉: 真理在缩水,还是上帝在掷骰子? | 统计之都 ( 中国统计学门户网站,... 页码,1/ 15 首页 关于我们 统计之都» 经典理论» 模型专题» 统计计算» 数据分析» 软件应用» 数学方法» 首页»推荐文章» 真理在缩水,还是上帝在掷骰子? 理在缩水,还是上帝在掷骰子? 2011/07/ 13 谢益辉 版权声明:本文版权归原作者所有,未经许可不得转载。原文可能随时需要修改纰漏,全文复制转载会带来不必要 的误导,若您想推荐给朋友阅读,敬请以负责的态度提供原文链接;点此查看如何在学术刊物中引用本文 最近在Google Reader 中看见科学松鼠会有两篇文章被频繁分享,名为《真理在缩水——现代科学研究方法并不尽善 尽美?》(上)与(下),下文简称《缩水》。文章很有意思,而实际上说的是我们的老本行——统计学,因此我在 这里也发表一些我的想法和理解,包括这两年我在美帝学习的一些思考,部分内容受益于两位老师Kaiser和Nettleton 教授,先向他们致谢 (尽管他们永远都不会看到这篇文章)。同时我也要先说明一下,读这篇文章可能会很花时间 (至少我花了大约二十小时写这篇文章),即使我的观点没有价值,我相信里面的引用文献是有价值的。 初读文章,我脑子里冒出的一句话是“上帝在跟我们掷骰子”,文中给出了大量的不可重复的试验,仿佛就像那些号称 “具有统计学意义” (下文我再说这个所谓的“意义” )的试验结果只是若干次骰子中的一次运气好的结果而已。读完文 章,我们可能不禁要问,到底是真理在缩水,还是它根本就不曾存在?下面我从四个方面来展开,分别说明人对随机 性的认识、统计推断的基石、让无数英雄折腰的P值、以及可重复的统计研究。 一、感知随机 随机变量在统计分析中占据中心地位,数学上关于随机变量的定义只是一个“干巴巴的函数”,从样本空间映射到实数 集,保证从实数集上的Borel域逆回去的集合仍然在原来的sigma域中即可。随机变量的性质由其分布函数刻画。写这 段话的目的不是为了吓唬你,也不是为了作八股文,而是来说明我为什么不喜欢数学的理由,对我而言,我觉得有些 数学工具只是为了让自己不要太心虚,相信某时某刻某个角落有个理论在支撑你,但后果是弱化了人的感知,当然, 也有很多数学工具有很强的直觉性 (如果可能,我想在未来下一篇文章里面总结这些问题)。我一直认为很多人对随 机性的感知是有偏差的,对概率的解释也容易掉进陷阱 (参见Casella Berger 的Statistical Inference第一章,例如条件 概率的三囚徒问题)。 《缩水》一文发表了很多不可重复的试验案例,我们应该吃惊吗?我的回答是,未必。举两个简单的例子: 第一个例子:很多数据分析人员都很在意所谓的“离群点”,论坛上也隔三差五有人问到这样的问题 (如何判断和处理 离群点),而且也有很多人的做法就是粗暴地删掉,我从来都反对这种做法。除了基于“数据是宝贵的”这样简单的想 法之外,另一点原因是,离群点也许并非“异类”。离群点是否真的不容易出现? 打开R或其它统计软件,生成30个 标准正态分布N(0, 1)随机数看看结果,比如R 中输入rnorm(30),这是我运行一次的结果: 1 rnorm(30) 2 [1] 1-02 0 -0-0 3 [7] 20 0-1-0-1 4 [13] -0-0-0 0 -0-1 5 [19] -0-1 0-0-0-0 6 [25] -0 0-0-0 0 -0 30在现实中是一个比较小的样本量,你看到了什么?2.901 ?它接近3倍标准差的位置了。还有2.089 ?……如果你不知 道这批数据真的是从标准正态分布中生成出来的

您可能关注的文档

文档评论(0)

asd522513656 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档