- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1、【授课时长】: 2、【目的】:介绍决策树的分类原理 3、【授课方式】: 4、【教学流程与讲述要点】: (1)决策树对数据进行连续的划分,使得预测变量的分布差异最大化,最后将数据分类到不同的分支和叶子中。 (2)决策树中,每个内部结点代表在一个属性上的划分,而每个树叶结点代表类或类分布。如上图,可以看出流失用户全都集中在年龄30的群体中,因此按年龄划分,能将存量用户和流失用户最明显的区分开。 (3)决策树的结果很直观,通常适用于理解哪些因素驱动了用户的购买行为,并且具有识别非线性关系的能力,通常能够用来筛选出其他模型的输入变量。 * 1、【授课时长】: 2、【目的】:说明决策树剪枝的重要性 3、【授课方式】: 4、【教学流程与讲述要点】: (1)通过表一的训练样本构建哺乳类动物分类决策树M1; (2)通过表二的检验样本测试模型分类的准确性; (3)虽然模型M1针对训练集的误差是0,但是由于训练集中含有误标记的记录蝙蝠和鲸,因此实际模型过拟合。在对检验样本的测试中,误差高达30,人和海豚都被误分类为非哺乳动物; (4)相反,经过剪枝的决策树M2,尽管它的训练差错率较高(20%),但是对于检验数据集具有较低的检验差错率(10%); * 1、【授课时长】: 2、【目的】:其他分类方式原理简介 3、【授课方式】: 4、【教学流程与讲述要点】: (1)预测(Prediction)是指由历史的和当前的数据推测未来数据趋势的能力; (2)最常用方法:回归预测法(引出回归效应的典故)。指根据预测的相关性原则,找出影响预测目标的各因素,并用数学方法找出这些因素与预测目标之间的函数关系的近似表达。例如:食物的热量和脂肪的含量关系、汽车行驶的距离同消耗汽油的关系; (3)相关分析与回归分析在实际应用中有密切关系。在回归分析中,所关心的是一个随机变量Y(因变量)对另一个随机变量X(自变量)的依赖关系的函数形式。在相关分析中,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。例如,以数学与语文成绩为例,相关分析感兴趣的是二者的关系如何,而不在于由X去预测Y。 (4)回归分析的分类: 4.1) 线性回归是量化连续变量之间关系的统计技术,将要预测的变量Y表示自变量X的线性函数,以单个自变量X为例,Y=α+βX+e,表现为穿过数据的一条直线,使得样本数据点到线上点间的方差最小; 4.2) 线性回归模型要求预测的变量Y是连续型的,但营销过程中经常要预测离散的结果(订购/未订购)。因此,逻辑回归将离散的营销结果变换成连续的值,即事件发生的概率,再使用回归技术进行预测; * 简单回归:‘简单’表示两个变量而不是多个变量的一种方法,并不是指字面意义上的方法简单; 多元回归:一种用于研究多个数值型自变量与一个数值型因变量之间关系的统计方法; 共线性现象:当我们引入一个与分析中其他自变量相关的分析变量时,回归系数就发生了改变。没有哪一个变量会保持唯一的系数值。系数会随着我们所用的其他变量而改变; 由上可知(相关关系=/=因果关系的例子):加入‘温度’这个分析变量后,冰激凌销量同车祸中儿童受伤数的回归系数应该接近0; * 1、【授课时长】: 2、【目的】:聚类原理简介 3、【授课方式】: 4、【教学流程与讲述要点】: (1)聚类是一种无指导学习。但与分类不同的是,它要划分的类是未知的,将数据对象分组成为多个类,使得属于同一类别的个体之间的差别尽可能的小,而不同类别上的个体见的差别尽可能的大。 (2)相似度是基于描述对象的属性值来计算的。距离是经常采用的度量方式。 (3)聚类的意义就在于将观察到的内容组织成类分层结构,把类似的事物组织在一起。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的关系 * 1、【授课时长】: 2、【目的】:神经网络原理简介 3、【授课方式】: 4、【教学流程与讲述要点】: (1)前馈式神经网络模拟人脑功能。它从每一个样本中提取信息进行模式学习。由多层节点组成,训练时先初始化每条连接上的权重值,输入样本后,系统将输出值与实际值进行比较,得到误差后,反馈给系统,调整权重。当达到预定的最小误差时训练结束。 (2)神经网络具备处理非线性关系的能力,这是回归通常难以做到的。但是神经网络的模型结果比较难以解释。 * 1、【授课时长】: 2、【目的】: 3、【授课方式】: 4、【教学流程与讲述要点】: (1) (2) * 1、【授课时长】: 2、【目的】:介绍手机阅读潜在用户挖掘的模型选择 3、【授课方式】: 4、【教学流程与讲述要点】: (1)根据预测模型的定义可供选择的方法有逻辑回归法、分类决策树法; (2)向学员演示上述三种模型参数的设置及具体运行方法; * 1、【授课时长】:
有哪些信誉好的足球投注网站
文档评论(0)