Clementine12.0操作剖析.pptxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Clementine 12.0使用指导 2014年4月14日 西安交大-美林数据挖掘研究中心 目录 2017-5-24 2 Clementine建模指导 二 总体介绍 一 公司在大数据领域业务方向 2017-5-24 3 总体介绍 Clementine的操作与数据分析的一般流程相吻合,包括数据收集,数据展示和预处理、模型建立、模型评价等环节, Clementine形象地将这些环节表示成若干节点,将数据分析过程看成数据在各个节点之间的流动,并通过一个图形化的“数据流”直观表示整个数据分析过程。 成功安装并启动Clementine后会出现主窗口, Clementine主窗口由数据流编辑区和三个窗口组成。 数据流编辑区域 流管理窗口 节点工具箱窗口 项目管理窗口 公司在大数据领域业务方向 2017-5-24 4 总体介绍 1.数据流编辑区域:建立和编辑Clementine数据流的区域。 2.节点工具箱窗口:数据流是由多个节点组成,工具箱中分类存放Clementine的所有节点 工具。这些节点均以图标形式显示,可实现数据采集、数据展示、数据(包括变量和样本) 预处理、数据建模以及模型评价等功能。它们被分别放置在Source、Record Ops、Field Ops、 Graphs、Modeling、Output和Export选项中,其中常用节点集中放置在Favorites选项卡中。 呈黄色背景显示的选项卡为当前选项卡。 3.流管理窗口:由Streams、Outputs、Model三张选项卡组成。可在Streams选项卡中 新建、打开、关闭、保存数据流。 Outputs选项卡中存放着执行数据流后生成的各种数据表, Models选项卡中存放着执行数据流后生成的各种模型计算结果。 4.项目管理窗口:多条数据流可组成一个数据挖掘项目。当数据挖掘任务较庞大而建立了 很多数据流时,可自行将流管理窗口中的服务于不同目标的数据流,分别存放到不同目录中。 公司在大数据领域业务方向 2017-5-24 5 总体介绍 数据流的操作主要包括以下四个方面: 1)选择和管理节点。 2)节点连接和连接调整。 3)设置节点参数。 4)执行数据流。 下图为一个简单的数据流,有向线段表示数据的流动方向。 公司在大数据领域业务方向 2017-5-24 6 总体介绍 1.选择和管理节点。 由于节点所实现的功能不同,因此被放置在不同的选项卡中。建立数据流时,根据实际需要,首先通过鼠标单击选择相应的选项卡,然后再通过鼠标双击或鼠标拖动操作,将某个节点工具选中并添加到数据流编辑区域中。包含如下选项卡: 收藏( Favorites)选项卡:存放数据流建立过程工程中最常用的节点工具。 数据源(Sources)选项卡:存放将各种外部数据读到Clementine中的节点工具。 记录(Record Ops)选项卡:存放针对记录操作的节点工具。通常,数据以行为单位组织,每一行为一条数据。数据库中称为记录,统计上称为样本。 公司在大数据领域业务方向 2017-5-24 7 总体介绍 字段( Field Ops)选项卡:存放针对字段操作的节点工具。数据库中称列为字段,统计上称为变量。 图形(Graphs)选项卡:存放展示数据分布特征和变量关系规律的可视化图形节点工具。 建模(Modeling)选项卡:存放建立各种数据模型的节点工具。 输出(Outputs)选项卡:存放展示数据和数据基本统计特征的节点工具。 导出(Export)选项卡:存放将数据转换成其他格式的节点工具。 公司在大数据领域业务方向 2017-5-24 8 总体介绍 2.节点连接和连接调整。 当数据流编辑区域中有两个节点A、B时,可通过有向线段实现A、B的连接。最方便的方法是鼠标右击节点A,按快捷键F2,指定将第一节点A和第二节点B相连。 删除节点A、B之间的连接。鼠标右击相应的有向线段,选择弹出菜单中的Delete Connection选项。 3.设置节点参数。 节点是用来处理数据的,需要对某些节点针对数据处理的方式设置参数。双击相应节点,或者右击相应节点,选择弹出菜单中的Edit即可。 4.执行数据流。 当数据流建立完成后,若要得到数据分析结果,则需要执行数据流。选择主菜单Tools-Execute,或右击会得结果的节点,选择弹出菜单中的Execute。 公司在大数据领域业务方向 2017-5-24 9 总体介绍 常用节点工具 数据源(Sources)选项卡中的Var.File节点、Excel节点。 Var.File节点可读入自由格式的文本文件,最常见的为

文档评论(0)

w5544434 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档