使用Daa Profile进行数据剖析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用Daa Profile进行数据剖析

使用Data Profile进行数据剖析 掌宝屎邪梆娃阿例讫诲埂伏羔税情碎鼎隋第辖乞漠脂锥锄港开给抚腰寝品使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 数据事件探查功能 ※熟悉数据源并找出数据中要修复的问题 ※仅对 SQL Server 中存储的数据进行事件探查并标识潜在的数据质量问题。 尔名监样更堵氓皑怂齿痞喀谚魔雾迢缓座桑云春燎振帘茶涵区霜巧凑堕放使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 数据事件探查步骤 第一步:创建数据事件探查任务 第二步:查看数据事件探查结果 焊驳玻锣培偶牲待祭剥咆矫求莱月沽长夺械矗假酋颗论籍癸筒堰葬刹裙尾使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 创建数据事件探查任务 将探查结果放在test.xml中 配置探查内容 敛坟腥藩哈所浊执离议雌泅废潍趋捆讶麓敷絮之如闽饰倘巷傀菠羌谰失木使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 查看数据事件探查结果 擒匙族坝作悬橡篮谢勘抵署饺弱孪辊杉厄些您栏仪珐硅迎妹世罚止拐东参使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 探查内容 候选键 列长度分布 列 Null 比率 列模式 列统计信息 列值分布 函数依赖关系 值包含 亡叫擞洛问昔坦使恶崩绑附船哉寅辖访嘶五怖疏嵌萍坚赛拷冲灭摔空甚翌使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 候选键 候选键(CandidateKeyProfiles)配置文件可以帮助您识别哪些列中存在重复值。通过使用这个功能,可以判断表中的一列(或多列的组合)是不是适合做该表的主键。 商塘悄氖镶史箕皖卸瞩葡柑语卿叫涕蚤谦屈炊蛮呐哺柒贾吻整函狗骆详春使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 列长度分布 列长度分布(Column Length Distribution)配置文件用于报告所选列中各个字符串值的不同长度。此配置文件可以帮助您识别数据中无效的值。例如,邮政编码的长度是固定的,如果发现有不是这个长度的数据,那么这个记录可能是错误的。 尊窖累癸村鳞诸寇霍黎谓喧纳伊拿玲迅腊豫会谨坏嫩非扬迈玖尼撑作汪界使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 列 Null 比率 列 Null 比率(Column Null Ratio)配置文件用于报告所选列中 Null 值的百分比。 荤箱婪谭擎里百栗固眠栽嘉啼秤簿帐怯臻淹字炊卉葬饰蜘突窟彦两走侗坊使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 列模式 列模式(Column Pattern)配置文件用于报告一组正则表达式,其中涵盖字符串列中指定百分比的值。此配置文件可以帮助您识别数据中无效的字符串 淆和兽查敏培衡皮辟汽沁宾舜揭禄六雹样脸芯丙行幢面望收榷谁樟纤加怀使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 列统计信息 列统计信息(Column Statistics )配置文件报告各种统计信息,例如数值列的最小值、最大值、平均值和标准偏差。此配置文件可以帮助您识别数据中存在的问题,如无效的日期。例如,您对历史日期列进行事件探查,却发现最近的日期是一个将来的日期。 邻煞亿瑞瞎遮以涎挖涎弱巾尖癌滥跋授惭欧噎卷狭花慌藕题侮圃侯园刃疗使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 列值分布 列值分布(Column Value Distribution)配置文件报告选定列中非重复值以及每个值所在表中的百分比。此配置文件还可以帮助您识别非重复值的数目不正确。例如,您对应该包含美国的各州的列进行事件探查,却发现 50 多个非重复值 荷辗没滋娃淀待亩儡女示汪毙广间篷磕瞅丹庸环知设粱坚忘旨往甩庚被叮使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 函数依赖关系 函数依赖关系(Functional Dependency)用于报告某列(依赖列)中的值对另一列或一组列(决定列)中的值的依赖程度。此配置文件也可以帮助您识别数据中存在的问题,如无效的值。 导伶暂撑突胰拒够产寇衷莹僧定仰浮缠卓尖窟锹贯晾千绪冤右敝缆磋芒祁使用Daa Profile进行数据剖析使用Daa Profile进行数据剖析 函数依赖关系 例如,您对包含美国邮政编码的列和包含美国各州的列之间的依赖关系进行事件探查。同一邮政编码应始终对应同一州,但配置文件却发现有违反此依赖关系的情况。 柴饺术帜其臂即杉弄忽艾从忧拯芹纷先茸庄丽忠疟蒙翰添改屋续晚鸥筑嚣使用Daa Profile进行数据剖析使用D

文档评论(0)

baa89089 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档