引言:为何可视化至关重要?

俗话说,“一图胜千言”。在数据分析领域,这句话尤其正确。原始的数据表格和统计摘要虽然精确,但往往难以揭示数据中隐藏的模式、趋势、异常值和关系。数据可视化通过将数据转换成图形,利用人类视觉系统的强大能力来快速识别这些信息,是**探索性数据分析(EDA)**中不可或缺的一环。

Matplotlib 是 Python 中最基础、最强大的数据可视化库。它为创建各种静态、动态和交互式图表提供了坚实的基础。几乎所有其他高级可视化库(如 Seaborn)都是在 Matplotlib 的基础上构建的。因此,掌握 Matplotlib 是进行任何严肃数据可视化的前提。

Matplotlib 的解剖学:Figure 与 Axes

要真正掌握 Matplotlib,首先需要理解其核心的两个对象:FigureAxes

  • Figure: 可以看作是整个图表的“画布”或“画框”。它是一个顶层容器,可以包含一个或多个图表(Axes)、标题、图例等所有绘图元素。
  • Axes: 这是实际的“绘图区域”或“子图”。我们平时所说的“一个图”,在 Matplotlib 的语境下通常指的就是一个 Axes 对象。它包含了数据点、x 轴(xaxis)、y 轴(yaxis)、刻度、标签等。一个 Figure 对象可以包含一个或多个 Axes 对象。

把它们想象成一幅画:Figure 是整个画框,而每个 Axes 是画框里的一幅独立的画。

两种绘图方式:Pyplot vs. 面向对象 (OO)

Matplotlib 提供了两种主要的绘图接口:

  1. Pyplot 接口 (状态机接口): 这是一系列函数的集合(如 plt.plot(), plt.title()),它会自动管理当前的 FigureAxes。这种方式对于快速、简单的绘图非常方便,其风格类似于 MATLAB。
  2. 面向对象 (OO) 接口: 这是更强大、更灵活的方式。我们首先显式地创建一个 Figure 对象和一个或多个 Axes 对象(通常使用 fig, ax = plt.subplots()),然后调用这些对象的方法来绘图和进行定制(如 ax.plot(), ax.set_title())。

为什么我们强烈推荐面向对象 (OO) 的方式?

对于初学者来说,pyplot 接口似乎更简单。然而,一旦你需要绘制更复杂的图表,比如在一个 Figure 中放置多个子图,或者对某个特定的子图进行精细控制时,pyplot 的状态机机制就会变得混乱和难以管理。你很难确定当前的 plt 函数到底作用于哪个子图。

面向对象的方式则从根本上解决了这个问题。通过 fig, ax = plt.subplots(),你得到了对 FigureAxes 对象的直接引用。当你调用 ax.set_title() 时,你非常清楚地知道这个标题是属于 ax 这个特定的子图的。这种明确的控制使得代码更具可读性、可维护性,并且是创建复杂、可复用图表的标准做法。从一开始就学习和使用 OO 风格,会为你未来的学习之路打下更坚实的基础。

你的第一张图 (使用 OO 风格)

让我们遵循标准的 OO 风格工作流,创建几种最常见的图表。

标准工作流:

  • 导入库: import matplotlib.pyplot as pltimport numpy as np
  • 准备数据
  • 创建 Figure 和 Axes: fig, ax = plt.subplots()
  • 在 Axes 上绘图: ax.plot(), ax.scatter() 等。
  • 定制图表: ax.set_title(), ax.set_xlabel(), ax.set_ylabel(), ax.legend()
  • 显示图表: plt.show()

折线图 (Line Plot)

折线图非常适合展示数据随时间或某个连续变量变化的趋势。

import matplotlib.pyplot as plt
import numpy as npx = np.linspace(0, 10, 100)
y = np.sin(x)# 1. 创建 Figure 和 Axes
fig, ax = plt.subplots()# 2. 在 Axes 上绘图
ax.plot(x, y)# 3. 定制图表
ax.set_title('Simple Sine Wave')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis (sin(x))')# 4. 显示图表
plt.show()

柱状图 (Bar Chart)

柱状图用于比较不同类别之间的数量。

import matplotlib.pyplot as pltcategories = ['A', 'B', 'C', 'D']
values = [23, 45, 55, 19]fig, ax = plt.subplots()
ax.bar(categories, values, color='skyblue')ax.set_title('Category Comparison')
ax.set_xlabel('Category')
ax.set_ylabel('Value')plt.show()

散点图 (Scatter Plot)

散点图用于可视化两个数值变量之间的关系,帮助我们发现相关性。

import matplotlib.pyplot as plt
import numpy as np# 生成随机数据
x = np.random.rand(50)
y = np.random.rand(50)
colors = np.random.rand(50)
sizes = 1000 * np.random.rand(50)fig, ax = plt.subplots()
# 使用 c 参数映射颜色,s 参数映射大小,cmap 指定颜色图谱
ax.scatter(x, y, c=colors, s=sizes, alpha=0.5, cmap='viridis')ax.set_title('Scatter Plot Example')
ax.set_xlabel('X Value')
ax.set_ylabel('Y Value')plt.show()

直方图 (Histogram)

直方图用于展示单个数值变量的分布情况。

import matplotlib.pyplot as plt
import numpy as np# 生成符合正态分布的随机数据
data = np.random.randn(1000)fig, ax = plt.subplots()
ax.hist(data, bins=30, edgecolor='black')ax.set_title('Distribution of Data')
ax.set_xlabel('Value')
ax.set_ylabel('Frequency')plt.show()

总结与展望

在本篇中,我们学习了 Matplotlib 的基本概念,特别是 FigureAxes 的区别,并强烈推荐了面向对象的绘图风格。我们还实践了如何使用 OO 风格创建四种最基本的图表:折线图、柱状图、散点图和直方图。

虽然 Matplotlib 功能强大且灵活,但有时绘制美观的统计图表需要编写较多的样板代码。为了解决这个问题,社区开发了 Seaborn。在下一篇文章中,我们将学习 Seaborn 如何在 Matplotlib 的基础上,用更简洁的代码创建出更具美感和信息量的统计图形。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89237.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89237.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/89237.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI基础1--线性代数(TODO)

1 前言 关于矩阵的运算,其实之前写过一篇:算法矩阵提速原理_矩阵分块计算速度会更快嘛-CSDN博客 还是那句话,计算机懂个毛的高等数学。只是矩阵运算的并行性和结构化特点与 SIMD/GPU 的执行模型非常一致。在实际硬件实现中,许多矩…

如何让宿主机完全看不到Wi-Fi?虚拟机独立联网隐匿上网实战!

“如何让宿主机完全看不到Wi-Fi?虚拟机独立联网隐匿上网实战!” 一、前言 在某些特定环境(如企业办公或信息安全测试)中,我们可能有这样的需求: 让宿主机无法识别或使用某个USB网络设备,但虚拟…

Excel基础操作知识笔记

​ 学习视频链接: ​​​​​​【公开课】Excel基础大全(1-66集)【超高清版】_哔哩哔哩_bilibili 深圳则秀教育官方账号的个人空间-深圳则秀教育官方账号个人主页-哔哩哔哩视频 Excel技巧零基础入门公开课小白(Excel表格制作|Exc…

【2025/06/30】GitHub 今日热门项目

GitHub 今日热门项目 🚀 每日精选优质开源项目 | 发现优质开源项目,跟上技术发展趋势 📋 报告概览 📊 统计项📈 数值📝 说明📅 报告日期2025-06-30 (周一)GitHub Trending 每日快照&#x1f55…

Oracle 进阶语法实战:从多维分析到数据清洗的深度应用​(第四课)

在《Oracle 树形统计再进阶》(第三课)基础上,我们跳出传统 SQL 聚合框架,探索Oracle 特有的高级语法特性,包括多维分析神器MODEL子句、数据清洗利器正则表达式、PL/SQL 存储过程优化,以及基于执行计划的查询调优技巧。这些技术能解…

SpringBoot -- 自动配置原理

SpringBoot 自动配置原理 基础知识 Bean扫描 我们在学习 Spring 的时候,如果要把标注一下注解的类扫描进 IOC 容器 Controller,Service,Mapper,是需要通过一下两种方式实现的,但是我们在 SpringBoot 工程中并没有编写…

Kubernetes从入门到精通-服务发现Service

一、为什么需要 Service? Pod 的动态性: Pod 是 Kubernetes 调度的基本单位。它们可能因为故障、滚动更新、扩缩容等原因随时被创建或销毁。 Pod IP 的不稳定性: 每个 Pod 都有自己的 IP 地址,但当 Pod 重建时,IP 地址…

Milvus 资源调度系统的核心部分:「查询节点」「资源组」「数据库」

Milvus 的资源管理分为三层:查询节点、资源组和 数据库。 查询节点:处理查询任务的组件。它在物理机或容器(如 Kubernetes 中的 pod)上运行。 资源组:查询节点的集合,充当逻辑组件(数据库和 C…

我的第一个开源项目:用Python搭建轻量级静态网页服务器—— 零基础也能实现的Web开发初体验

一、为什么选择静态服务器? 极简高效:无需数据库或复杂后端逻辑,适合展示简历、作品集等静态内容 学习曲线平缓:是理解HTTP协议和Web服务原理的最佳入门方式 资源消耗低:单文件Python脚本即可运行,内存占…

github 图床使用免费CDN加速(jsdelivr)

github做图床大部分人都知道,但是国内访问速度不稳定,所以使用jsdelivr加速。 jsdelivr是什么呢?它是一个免费、快速和可信赖的CDN加速服务,直接集成在github中的,无需额外操作即可使用。 本文分两部份,最…

lte高阶调制和AMC

文章目录 LTE高阶调制AMC LTE高阶调制 首先什么是调制?调制是把通信系统中的基带信号(低频)转化成适合信道传输的高频信号的过程。 波长(λ)与频率(f) 基本关系: λc/f,λc/f&…

shardingsphere5.2.1与SpringBoot3.X的版本冲突问题

1.先说一下我的版本配置与遇到的问题 问题产生的依赖和版本: 主要依赖依赖版本jdk17SpringBoot 3.3.13shardingsphere-jdbc 5.2.1 问题产生的原因: 主要就是shardingsphere-jdbc 与SpringBoot版本冲突,因为Spring Boot 需要 SnakeYAML 库来解…

FPGA控制88E1512 PHY芯片完成网络通信

一、88E1512分析 本文不对88E1512进行详细解析,仅对调试过程中重点使用的几个寄存器进行说明。 1.1 MDIO时序分析 根据手册,MDIO时序中,mdc时钟最高为12Mhz。占空比和建立保持时间要求可以观察上述表格。 MDIO的读数据时序图如下&#xff1a…

Ai大模型 - ocr图像识别形成结构化数据(pp-ocr+nlp结合) 以及训练微调实现方案(初稿)

全局目录,一步到位 功能流程第一阶段 基于现有条件进行 调研,测试与评估1.1 ocr深度学习模型 pp-ocr1.2 nlp结构化模型1.3 硬件要求: 第二阶段 模型训练微调2.1 更换ocr-GPU模型, 下载相关环境2.2 nlp模型 语义训练2.3 最低硬件要求:2.4 样本数据: (重点)2.5 进一步增强模型能力…

【Linux】软硬链接,动静态库

目录 一、认识一下常用指令 1、建立一个软链接 2、建立一个硬链接 3、删除文件的第二种方式:删除链接unlink指令 二、什么是硬链接? 三、软硬链接的原理: 四、应用场景 1、建立一个软链接可以快速在一个比较深的路径中找到目标文件进行…

VRR(可变刷新率)和QMS(快速媒体切换)

🔧 一、技术原理的本质区别 技术VRR (可变刷新率)QMS (快速媒体切换)核心目标消除动态帧率波动导致的画面撕裂/卡顿消除静态帧率切换时的黑屏中断工作机制实时调整显示器刷新率(Hz)匹配GPU输出帧率(FPS)→ 动态延长/缩…

GO 语言学习 之 Map

map 是 Go 语言中非常重要的数据结构,常用于需要快速查找、统计或分组数据的场景。 map定义: package mainimport "fmt"func main() {var m1 map[int]string // 创建一个 mapm2 : make(map[int]string) // 创建一个 map m3…

什么是可观测性?监控、日志、追踪三者之间有什么区别?

一、引言:为什么现代系统需要“看得见”? 你是否遇到过这样的情况:系统运行突然变慢,但没人知道问题出在哪?随着微服务、云原生架构的普及,系统的复杂度越来越高,传统的“靠经验判断”已经无法…

扣子(coze)实战|自动搬运+改写+归档!自媒体矩阵终极方案

今天给大家分享的是用coze做一个工作流来自动提取抖音/小红书视频文案及改写并传入到飞书多维表格,我们先来看案例 上传视频链接即可一键生成,废话不多说,上教程~ 一、整体工作流如下: 二、开发思路: 三、详细工作流分…

K8s环境下基于Nginx WebDAV与TLS/SSL的文件上传下载部署指南

#作者:闫乾苓 文章目录 1.问题及背景2.方案说明3.部署步骤3.1 制作TLS/SSL私有证书3.2 创建访问nginx账户密码文件并创建secret3.3 为TLS/SSL私有证书创建secret3.4 为Nginx 配置文件创建confimap3.5 使用deployment,svc部署nginx3.6 客户端curl上传下载…