《财务大数据分析与可视化》课件3-数据清洗2.pptx

《财务大数据分析与可视化》课件3-数据清洗2.pptx

  1. 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
  2. 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  3. 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据清洗Datacleaning项目三?数据预处理Datacleaning

数据清洗流程设计可以遵守的法则:1.少量数据。先合并、联接再清洗;2.大数据源接入。先按照统一标准清洗,再接入;3.每个数据计算层。先清洗再计算;4.分析结果发现数据问题。向前溯源,新增、修订清洗规则。

数据清洗流程设计1.一个清洗步骤就用一条清洗规则;2.多拆分清洗步骤,每个步骤备份数据,方便出问题时回退;3.一般先做全局清洗(即对全部数据),再做个别字段的清洗;4.清洗的输出结果不要直接放在正式数据流\正式文件中,先用测试环境\临时文件充分验证后上正式环境。

数据清洗工具介绍将要清洗的数据上传对整张表进行清

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档