- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【干货教程】数据建模那点事讲述
HYPERLINK /archives/38339 数据建模那点事儿
雪姬
2015-12-21 9:57:48
HYPERLINK /archives/category/ganhuo 干货教程
评论(2)
作者:陈丹奕
今天要说内容是建模。为啥我作为一个数学能力并不强的人要在这献丑讲建模的事呢?其实我的目的很简单,就是为了告诉大家一个事实:数据分析中的建模,并没有想象中那么高深莫测,人人都有机会做出自己的模型。
第一部分:数据建模理论和逻辑
一、从数据分析的定义开始
维基百科对数据分析的定义如下:
Analysis of data is a process of inspecting, cleaning, transforming, and modeling data with the goal of discovering useful information, suggesting conclusions, and supporting decision making. Data analysis has multiple facets and approaches, encompassing diverse techniques under a variety of names, in different business, science, and social science domains.(来源: HYPERLINK /wiki/Data_Analysis \t _blank Data analysis)
简单翻译:数据分析是一个包含数据检验、数据清洗、数据重构,以及数据建模的过程,目的在于发现有用的信息,有建设性的结论,辅助决策的制定。数据分析有多种形式和方法,涵盖了多种技术,应用于商业、科学、社会学等多个不同的领域。
和上篇文章中我画的图对比一下:
我在上篇文章中为了让初学者更容易走通全流程,简化了数据清洗的过程,实际上数据清洗绝非一次完成,“检验-清洗-检验”的过程可能会重复数次乃至数十次。
而建模呢?再次引用维基上对数据建模的定义:
Data modeling is a process used to define and analyze data requirements needed to support the business processes within the scope of corresponding information systems in organizations. Therefore, the process of data modeling involves professional data modelers working closely with business stakeholders, as well as potential users of the information system.(来源: HYPERLINK /wiki/Data_modeling \t _blank Data modeling)简单翻译:数据建模是一个用于定义和分析在组织的信息系统的范围内支持商业流程所需的数据要求的过程。因此,数据建模的过程需要专业建模师与商业人员和信息系统潜在???户的紧密合作。这段话的定义更偏向信息系统和商业数据建模,我之所以在此引用这段话,是为了明确接下来的讨论内容主要方向是商业数据分析和建模,至于科学研究方向的数据建模,不在这篇文章的讨论范围以内。
请注意上边这段话中的一个核心:支持商业流程。商业数据建模,乃至商业数据分析,其最终目的都是要支持某种商业流程,要么优化原有流程,提高各部分效率;要么重构原有流程,减少步骤;要么告诉决策者,哪些流程改造方向是错误的,以避免走错路。最终的目标,一定是提升效率。但在不同的情况下,提升效率的方式也是不同的,因此在每个模型建立时,都需要确定其解决的具体目标问题。
再往前走一步,数学—主要是统计学,在建模的过程中又扮演什么样的角色呢?继续引用维基:
Mathematical formulas or models called algorithms may be applied to the data to identify relationships among the variables, such as correlation or causation. In general terms, models may be developed to evaluate a particular variable in the data based on other variable(s) in
您可能关注的文档
- 【典中点】2016秋苏教版七年级语文上册:期末检测卷讲述.doc
- 【决胜2015】(压轴题)中考物理专题07热学之温度、热量和内能的联系与区别(含解析)讲述.doc
- 第2讲老空水预防综述.ppt
- 【创新设计】2017高考生物一轮复习第7单元第22讲人类遗传病及遗传系谱分析与应用新人教版讲述.doc
- 【公路工程试验检测试卷库】公路专业路基路面试题10套+答案讲述.doc
- 【优化设计】2016中考物理总复习单元综合检测卷五电路欧姆定律电功率讲述.doc
- 【人教版】八年级物理上册:1.4《测量平均速度》教案设计讲述.doc
- 【创新设计】2014-2015高中物理3.2牛顿第一定律(第2课时)教科版必修1讲述.doc
- 【南方新中考】(梅州)2015中考语文第一部分基础整合第三章标点符号与病句的辨析、修改检测复习讲述.doc
- 【北师大版】2016版七上:2.6《有理数的加减混合运算(第3课时)》课件讲述.pptx
- 2025届湖北省武汉市新洲区中考历史最后一模试卷含解析.doc
- 辽宁省丹东市第十四中学2025届中考冲刺卷生物试题含解析.doc
- 方兴大道承台砼施工技术交底.docx
- 江苏省扬州市田家炳实验中学2025届中考历史全真模拟试卷含解析.doc
- 2025届黑龙江省杜尔伯特县中考二模化学试题含解析.doc
- 海南省海口九中学海甸分校2025届中考生物模拟试卷含解析.doc
- 江苏省春城中学2025届中考生物全真模拟试卷含解析.doc
- 广东省广州市番禺区广博校2025届中考猜题历史试卷含解析.doc
- 安徽省合肥市重点中学2025届中考四模历史试题含解析.doc
- 河北省衡水市故城县2025届中考生物押题试卷含解析.doc
文档评论(0)