- 1、本文档共65页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Python数据可视化案例教程
全课导航项目1搭建数据可视化开发平台项目2Python数据可视化基础项目3比较型数据可视化项目5关联型数据可视化项目4分布型数据可视化项目6比例型数据可视化项目7时间型数据可视化项目8文本型数据可视化项目9地理空间型数据可视化项目10点评网站美食店铺数据可视化
项目4分布型数据可视化
知识目标了解分布型数据的概念及应用场景。了解直方图、箱形图、密度图和小提琴图的概念及应用。掌握使用seaborn绘制直方图、箱形图、密度图和小提琴图的方法。技能目标能使用直方图、箱形图、密度图和小提琴图对分布型数据进行可视化和分析。素养目标培养实践能力,在实践中学习、在学习中实践。强化身体健康安全意识,敬畏生命、珍惜生命。项目目标
分布型数据可视化常用于呈现和探索数据的分布情况,帮助用户了解数据的集中趋势、离散程度、偏态和峰度等特征,以及发现数据中的异常值和离群点。分布型数据可视化可以应用于许多场景,如市场研究、环境监测、人口统计等。本项目将基于某高校一年级学生的体质指数实现分布型数据可视化。项目描述
按照项目要求,将“某高校一年级学生体质指数.xlsx”文件中的数据进行可视化的方法如下。(1)使用直方图实现不同体质指数区间学生数量可视化。首先新建Python文件;然后编写代码,实现从数据源中读取数据,使用seaborn绘制不同体质指数区间学生数量直方图;最后对图表进行分析。(2)使用小提琴图实现不同性别学生体质指数可视化。首先新建Python文件;然后编写代码,实现从数据源中读取数据,使用seaborn绘制不同性别学生体质指数小提琴图;最后对图表进行分析。项目分析
为了更好地实现某高校一年级学生体质指数可视化,本项目将对相关知识进行介绍,包括分布型数据的概念及应用场景,直方图、箱形图、密度图和小提琴图的概念及应用,以及使用seaborn绘制这些图表的方法。项目分析
全班学生以3~5人为一组,各组选出组长。组长组织组员扫码观看“常见的分布型数据及可视化图表”视频,讨论并回答下列问题。问题1:列举生活中常见的分布型数据。问题2:列举常见的分布型数据可视化图表。项目准备常见的分布型数据及可视化图表
4.1?什么是分布型数据4.2直方图项目实施——某高校一年级学生体质指数可视化项目导航4.3箱形图4.4密度图4.5小提琴图
4.1?什么是分布型数据
4.1什么是分布型数据分布型数据主要是指用于描述数据值在某个范围内分布情况的数据。可以是连续型的分布型数据可以是离散型的如身高、体重等如人口、性别等
4.1什么是分布型数据与确定性数据相比,分布型数据具有一定的随机性和不确定性。可以揭示数据的规律、趋势和模式通过对分布型数据进行统计描述和可视化分析用于后续的数据建模、预测和决策
分布型数据可视化常用的图表直方图箱形图密度图小提琴图4.1什么是分布型数据
对分布型数据进行统计描述和可视化分析有什么作用?分布型数据可视化常用的图表有哪些?课堂检测
什么是分布型数据课堂小结
4.2?直方图
4.2直方图直方图是一种将数据的值划分为若干个等宽、不重叠的区间,并统计每个区间内数据数量或分布概率的图表,它可以表示数据的分布情况,如不同成绩区间的学生数量分布、不同年龄区间的员工数量分布等。直方图是一个连续变量的概率分布估计,因此它还可以用于分析数据是否符合正态分布。
4.2直方图数据所属的区间区间对应数据的数量或占比
使用直方图实现某餐厅不同消费金额区间消费次数可视化。【例4-1】本案例基于“某餐厅顾客消费记录.xlsx”文件中的数据,使用seaborn的histplot()函数绘制直方图。函数中,x为“消费金额(元)”列标签,颜色映射hue为“顾客类型”列标签,data为读取的DataFrame格式的数据,矩形柱的个数bins为15,直方图类型multiple为“stack”(堆积直方图)。【问题分析】4.2直方图
提示由于绘制图表的步骤基本一致,案例和项目实施不再详细讲解步骤,只分析重点。
importpandasaspd#导入pandas库#导入matplotlib库中的pyplot模块importmatplotlib.pyplotaspltimportseabornassns#导入seaborn库df=pd.read_excel(‘某餐厅顾客消费记录.xlsx’)#读取
您可能关注的文档
- 《网络设备配置与管理》项目二 使用交换机构建简单局域网.pptx
- 《网络设备配置与管理》项目六 使用动态路由实现网络互联.pptx
- 《网络设备配置与管理》项目七 网络安全管理.pptx
- 《网络设备配置与管理》项目三 划分虚拟局域网(VLAN).pptx
- 《网络设备配置与管理》项目四 优化交换式网络.pptx
- 《网络设备配置与管理》项目五 使用静态路由实现网络互联.pptx
- 《网络设备配置与管理》项目一 网络基础知识.pptx
- 《Python数据可视化案例教程》 项目1 搭建数据可视化开发平台.pptx
- 《Python数据可视化案例教程》 项目2 Python 数据可视化基础.pptx
- 《Python数据可视化案例教程》 项目3 比较型数据可视化.pptx
文档评论(0)