数学中国培训讲义.pdfVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学中国培训(之 数学中国培训(之 数数学学中中国国培培训训((之之数据分析概论) 作者:韩海涛 大家好,这里是数学中国,数学建模在线培训活动。我是数学中国超级版主 韩海涛。我们这次讲的内容是数据分析概论。 数学中国讲师 19:01:33 数据分析是一个非常庞大的议题,所包含的原理和技术不可能在一次培训中 得到充分涵盖。所以我们在这一次培训当中,只讲一些最基本的内容。偏向 于基本概念的介绍,具体技术介绍得较少。 数学中国讲师 19:02:24 有一些具体的计算方法同学们可以自己在相应书籍当中查到。为了达到较大 的适用范围,本次培训内容尽量减少概率和统计术语的使用,偏向目的性的 介绍而不追求数学上的严格性,内容可能对某些赛题有一点作用,但其设计 并不针对特定赛题。 数学中国讲师 19:03:43 统计学、数据挖掘和机器学习等学科从本质上讲都是在收集和分析数据。它 们的偏向各有不同,统计有专门的统计专业,而数据挖掘和机器学习则属于 计算机专业。但从学科性质上讲,完全没有必要强调它们的不同,事实上, 它们的目的无非都是从数据中寻找信息,所以我们可以把它们看成统一的学 科。 数学中国讲师 19:06:24 我们通过数据分析得到的信息,从性质上和数据本身是相关的。激进一点说, 我们能得到的充其量就是“数据如何生成”的信息。更多的负担不要都加在 数据分析这项工作上,它可不一定能承担得起。 数学中国讲师 19:07:38 实际的世界是先有某种机制,再通过该机制产生了许多可观测的数据。而数 据分析则是这个流程的反问题,通过观察到的数据反演原来的机制是什么。 数学中国讲师 19:08:40 所以我们的数据原则上是可靠的,但毕竟有限,所以不够全面。推得的信息 要求具有普遍性,但毕竟带有推测性,不能强求其绝对吻合真实。这也是数 学建模的特点,不强求“正确”,更多的是“合理”或者“有用” 数学中国讲师 19:10:08 严格地讲,数据分析不是一次就能彻底结束的操作,而是一个不间断的流程。 不仅为了回答特定的问题,而且应该能指示如何改进,以提供进一步研究的 导向。 数学中国讲师 19:11:26 正因为如此,一次完整的数据分析流程,一定要包含如下几个步骤: 1:数据收集; 2:数据清洗和交叉检验; 3:建模; 4:推断分析、决策及结论; 5:对进一步调查分析的导向; 数学中国讲师 19:12:51 这几个步骤大致是按照时间顺序来排列的,但是其中也有交叉的部分。尤 其是“建模”这里,从刚接触到数据,就已经开始有了模型的介入。直到 最终,模型也拥有不可或缺的影响力。所以这个划分不是机械的。我们下 面分别叙述这些步骤的主要内容。即使是概述,估计一次也讲不完。如果 有必要,以后可以继续组织培训活动。 数学中国讲师 19:14:33 (第一步)数据收集是数据分析的第一步。 在数学建模中,由于我们很少需要进行实地调查和设计实验,所以只谈谈 如 何抽样就可以了。 数学中国讲师 19:16:14 有时可以获取的数据太多,处理起来困难,而且这些数据可能并不都是必 需的。所以需要进行抽样,只分析抽到的样本就可以了。这些样本需要代 表总体情况,所以在设计抽样方案的时候,我们需要刻意避免加入人为的 偏倚(bias)。 数学中国讲师 19:17:50 最简单的抽样方法就是随机抽样:从总体中等概率地抽取若干样本并加以 分析。如果运气不好,抽到的样本恰好是有偏的,得到的结论当然就不适 用。但我们可以有效地评估风险。 数学中国讲师 19:19:21 例如: 我们分析中国人的平均身高,随机抽取了100人作为样本。如果真的随机 抽到了1

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档