第三讲_数据分析工具Pandas.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
法律声明  本课件包括:演示文稿,示例,代码,题库,视频和声 音等,小象学院拥有完全知识产权的权利;只限于善意 学习者在本课程使用,不得在课程范围外向任何第三方 散播。任何其他人或机构不得盗版、复制、仿造其中的 创意,我们将保留一切通过法律手段追究违反者的权利。  课程详情请咨询  微信公众号:大数据分析挖掘  新浪微博:ChinaHadoop 互联网新技术在线教育领航者 第三讲 LOGO 数据分析工具Pandas --梁斌 互联网新技术在线教育领航者 目录 • Pandas的数据结构 • Pandas的数据操作 • Pandas统计计算和描述 • 数据的分组与聚合 • 数据清洗、合并、转化和重构 • 聚类模型:K-Means • 实战案例:全球食品数据分析(Open Food Facts ) 互联网新技术在线教育领航者 什么是Pandas Pandas • 一个强大的分析结构化数据的工具集 • 基础是NumPy ,提供了高性能矩阵的运算 • 应用,数据挖掘,数据分析 • 如,学生成绩分析、股票数据分析等。 • 提供数据清洗功能 互联网新技术在线教育领航者 目录 • Pandas的数据结构 • Pandas的数据操作 • Pandas统计计算和描述 • 数据的分组与聚合 • 数据清洗、合并、转化和重构 • 聚类模型:K-Means • 实战案例:全球食品数据分析( Open Food Facts ) 互联网新技术在线教育领航者 Pandas的数据结构 Series • 类似一维数组的对象 • 通过list构建Series • ser_obj = pd.Series(range(10)) • 由数据和索引组成 • 索引在左,数据在右 • 索引是自动创建的 • 获取数据和索引 • ser_obj.index, ser_obj.values • 预览数据 • ser_obj.head(n) 示例代码: 01_pandas_data_structures.ipynb 互联网新技术在线教育领航者 Pandas的数据结构 Series (续) • 通过索引获取数据 • ser_obj[idx] • 索引与数据的对应关系仍保持在数组运算的结果中 • 通过dict构建Series • name属性 • ser_, ser_ 示例代码: 01_pandas_data_structures.ipynb 互联网新技术在线教育领航者 Pandas的数据结构 DataFrame 示例代码: 01_pandas_data_structures.ipynb • 类似多维数组/表格数据 (如,excel, R中的data.frame) • 每列数据可以是不同的类型,what about ndarray? • 索引包括列索引和行索引 互联网新技术在线教育领航者 Pandas的数据结构 示例代码: 01_pandas_data_structures.ipynb DataFrame • 通过ndarray构建DataFrame • 通过dict构建DataFrame • 通过列索引获取列数据(Series类型 ) • df_obj[col_idx] 或 df_obj.col_idx • 增加列数据,类似dict添加key-value • df_obj[new_col_idx] = data • 删除列 • del df_obj[col_idx] 互联网新技术在线教育领航者 Pandas的数据结构 索引对象Index • Series和DataFrame中的索引都是Index对象 • 不可变(immutable) • 保证了数据的安全 • 常见的Index种类 • Index • Int64Index

文档评论(0)

新华书局 + 关注
实名认证
文档贡献者

新华书局,精选好书

1亿VIP精品文档

相关文档