《人工智能通识》知识拓展汇总 Chap 2 数据清洗和预处理方法 ---Chap 13 助力美丽中国建设.doc

《人工智能通识》知识拓展汇总 Chap 2 数据清洗和预处理方法 ---Chap 13 助力美丽中国建设.doc

  1. 1、本文档共21页,其中可免费阅读13页,需付费50金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据清洗和预处理方法

1.数据清洗

采集到的数据通常包含噪声和错误,称为“脏数据”,需要进行数据清洗。经过数据清洗,将存在错误的、缺失的,处理为正确、完整的可分析数据。数据清洗方法主要包括去除重复数据、填补缺失数据、处理异常数据等。见表2-9。

表2-9数据清洗的方法

清洗

内容说明

去除重复数据

通过比较数据集内的记录,识别并删除重复的记录,确保每条记录的唯一性

处理缺失值

对于数据集中的缺失值,可以选择多种处理方式。常见的包括删除含有缺失值的记录,或使用均值、中位数、众数等统计值进行填充,也可以使用基于模型(如回归模型)预测的值进行填补

错误数据修正

识别并修正数据中的错误,如拼写错误、逻

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档