[Python 数据可视化] 用 Matplotlib 绘制精美的图表!
【Python数据可视化】利用Matplotlib绘制美丽图表!
数据可视化是数据分析过程中的重要步骤,它能直观地展示数据的趋势、分布和相关性,帮助我们做出明智的决策。在 Python 中,Matplotlib 是最常用的可视化库之一,它功能强大,支持多种图表类型和高度自定义的图形绘制。本文将详细介绍如何使用 Matplotlib 绘制各种美观的图表,并通过实例演示如何掌握这些技巧。
目录
- 什么是 Matplotlib?
- 安装 Matplotlib
- Matplotlib 基本使用
- 绘制简单的折线图
- 自定义图表样式和主题
- 绘制柱状图与直方图
- 绘制散点图与气泡图
- 添加标题、标签和注释
- 多子图布局
- 保存和导出图表
1. 什么是 Matplotlib?
Matplotlib 是 Python 中一个广泛使用的 2D 图形绘图库,提供了从简单到复杂的各种图表类型。它以简单易用的 API 和丰富的自定义能力为用户所喜爱。无论是科研、工程应用,还是金融数据分析,Matplotlib 都能帮助用户将数据以直观的方式呈现出来。
一些常见的图表类型包括:
- 折线图(Line Plot)
- 柱状图(Bar Chart)
- 散点图(Scatter Plot)
- 饼图(Pie Chart)
- 箱线图(Box Plot)
2. 安装 Matplotlib
如果你还没有安装 Matplotlib,可以通过 pip 命令快速安装:
pip install matplotlib
3. Matplotlib 基本使用
在使用 Matplotlib 时,通常会导入 matplotlib.pyplot
模块,并使用 plt
作为别名。这是最常见的使用方式,因为 pyplot
提供了绘制图表的核心函数。
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制折线图
plt.plot(x, y)
# 显示图表
plt.show()
以上代码绘制了一条简单的折线图。plt.plot()
是绘制折线图的函数,plt.show()
则是显示图表的函数。
4. 绘制简单的折线图
折线图是展示数据变化趋势的常用图表。下面的示例演示了如何创建一个带有标题和轴标签的折线图。
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制折线图
plt.plot(x, y, marker='o', color='b', linestyle='-', label='Prime numbers')
# 添加标题和标签
plt.title("Simple Line Plot")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
# 添加图例
plt.legend()
# 显示图表
plt.show()
自定义折线图
-
marker
:标记数据点的样式。 -
color
:线条颜色。 -
linestyle
:线条样式,如实线('-'
)、虚线('--'
)等。 -
label
:用于图例的标签。
5. 自定义图表样式和主题
Matplotlib 提供了多种内置样式,允许用户轻松更改图表的外观。你可以使用 plt.style.use()
方法应用预定义的样式。
import matplotlib.pyplot as plt
# 应用样式
plt.style.use('ggplot')
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制折线图
plt.plot(x, y, marker='o')
# 显示图表
plt.show()
常用样式包括:
-
ggplot
:模仿 R 语言中的 ggplot2。 -
seaborn
:简洁而美观的样式。 -
bmh
:适合黑白打印。
6. 绘制柱状图与直方图
柱状图用于展示分类数据,而直方图通常用于显示数据的分布情况。
柱状图
import matplotlib.pyplot as plt
# 示例数据
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 1, 8]
# 绘制柱状图
plt.bar(categories, values, color='skyblue')
# 添加标题和标签
plt.title("Bar Chart Example")
plt.xlabel("Categories")
plt.ylabel("Values")
# 显示图表
plt.show()
直方图
直方图展示数据的频率分布,是数据分析中常见的工具。
import matplotlib.pyplot as plt
import numpy as np
# 生成随机数据
data = np.random.randn(1000)
# 绘制直方图
plt.hist(data, bins=30, color='green', alpha=0.7)
# 添加标题和标签
plt.title("Histogram Example")
plt.xlabel("Value")
plt.ylabel("Frequency")
# 显示图表
plt.show()
7. 绘制散点图与气泡图
散点图用于展示两个变量之间的关系。通过改变点的大小,可以扩展为气泡图。
散点图
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制散点图
plt.scatter(x, y, color='red', marker='x')
# 添加标题和标签
plt.title("Scatter Plot Example")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
# 显示图表
plt.show()
气泡图
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
sizes = [20, 50, 80, 200, 500] # 气泡大小
# 绘制气泡图
plt.scatter(x, y, s=sizes, color='purple', alpha=0.5)
# 添加标题和标签
plt.title("Bubble Chart Example")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
# 显示图表
plt.show()
8. 添加标题、标签和注释
为了让图表更具可读性,应该为每个图表添加合适的标题、坐标轴标签以及注释。
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制折线图
plt.plot(x, y, marker='o')
# 添加标题、轴标签
plt.title("Line Plot with Annotations")
plt.xlabel("X-axis")
plt.ylabel("Y-axis")
# 添加注释
plt.text(3, 5, "Peak Point", fontsize=12, color='green')
# 显示图表
plt.show()
9. 多子图布局
在同一个窗口中展示多个图表,可以使用 subplot()
或 subplots()
方法。subplot()
可以在一个网格中绘制多个子图。
import matplotlib.pyplot as plt
# 创建一个 2x1 网格的子图
plt.subplot(2, 1, 1)
plt.plot([1, 2, 3], [1, 4, 9])
plt.subplot(2, 1, 2)
plt.plot([1, 2, 3], [1, 2, 3])
# 显示图表
plt.show()
10. 保存和导出图表
Matplotlib 支持将图表保存为多种格式,如 PNG、PDF 等。使用 savefig()
方法可以保存图表。
import matplotlib.pyplot as plt
# 示例数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
# 绘制折线图
plt.plot(x, y)
# 保存图表为 PNG 文件
plt.savefig("line_plot.png")
# 显示图表
plt.show()
总结
Matplotlib 是一个功能丰富、易于使用的 Python 可视化库。通过本文的介绍,你学到了如何使用 Matplotlib 绘制折线图、柱状图、散点图等常见图表,如何自定义图表样式,以及如何进行
上一篇: [Linux]:线程控制
推荐阅读
-
[Python 数据可视化] 用 Matplotlib 绘制精美的图表!
-
python 数据分析 - 数据可视化(图表绘制基础知识)
-
数据可视化---使用matplotlib绘制高级图表(2)
-
用 Python 获取链家二手房房源数据,制作可视化图表分析数据
-
包婷婷 (201550484)作业一 统计软件简介与数据操作-SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。 1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。 R统计软件介绍 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。 与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。 该语言的语法表面上类似 C,但在语义上是函数设计语言(functional programming language)的变种并且和Lisp 以及 APL有很强的兼容性。特别的是,它允许在"语言上计算"(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模拟和绘图非常有用。 R是一个免费的*软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在R主页那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。 二、R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点: 1.R是*软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。[2] 2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。[2] 3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.[2] 4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2] 5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.[2] R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。 但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。[3] 。 R语言的下载可以通过CRAN的镜像来查找。 R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由 中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和 USTC提供的。 三、stata Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。 新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。 除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过Stata. Journal获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。 四、PYTHON
-
python pyecharts 地理数据可视化 绘制地理图表
-
用Seaborn和matplotlib创建个性化的3D图表:商业数据可视化的新视角