Pandas2.2 DataFrame

Time Series-related

方法描述
DataFrame.asfreq(freq[, method, how, …])用于**将时间序列数据转换为指定频率(resample to frequency)**的方法
DataFrame.asof(where[, subset])用于查找时间序列中最接近指定时间点的非 NaN 值的方法
DataFrame.shift([periods, freq, axis, …])用于**将 DataFrame 的数据沿着指定轴移动(平移)**的方法
DataFrame.first_valid_index()用于获取 DataFrame 中第一个非空(非 NaN)值所在的行索引的方法
DataFrame.last_valid_index()用于获取 DataFrame 中最后一个非空(非 NaN)值所在的行索引的方法
DataFrame.resample(rule[, axis, closed, …])用于**对时间序列数据进行重采样(resampling)**的核心方法

pandas.DataFrame.resample()

pandas.DataFrame.resample() 是 Pandas 中用于**对时间序列数据进行重采样(resampling)**的核心方法。它类似于 SQL 中的“GROUP BY 时间窗口”操作,常用于将高频时间序列数据聚合为低频(如从分钟级到小时级、日级等),也支持升采样(插值填充)。


📌 方法签名
DataFrame.resample(rule,axis=0,closed=None,label=None,convention='start',kind=None,on=None,level=None,origin='start_day',offset=None,group_keys=False
)

🔧 参数说明:
参数说明
rule时间频率字符串,如 'D'(天)、'W'(周)、'M'(月)、'Q'(季度)、'A'(年)等
axis操作轴方向,默认为 0(行方向)
closed区间闭合方式,可选 'left''right',表示区间端点是否包含
label聚合后标签的位置,可选 'left''right'
convention升采样时的时间点对齐方式,如 'start', 'end'(默认 'start'
kind返回类型,可选 'period''timestamp'
on对非索引的时间列进行 resample(适用于普通列而非 DatetimeIndex)
level多级索引中指定某一级作为时间索引
origin起始时间对齐方式,可选 'epoch''start_day'(默认)
offset时间偏移量,如 '1D' 表示起始时间向后偏移一天
group_keys是否在分组键中显示时间标签(一般不需修改)

✅ 返回值
  • 返回一个 Resampler 对象,需要配合 .mean(), .sum(), .max() 等聚合函数使用;
  • 原始数据不会被修改;

🧪 示例代码及结果
示例 1:基本用法(按天聚合)
import pandas as pd
import numpy as np# 创建带时间索引的 DataFrame
index = pd.date_range('2025-01-01', periods=6, freq='H')
df = pd.DataFrame({'value': [10, 20, 30, 40, 50, 60]
}, index=index)print("Original DataFrame:")
print(df)
输出:
                     value
2025-01-01 00:00:00     10
2025-01-01 01:00:00     20
2025-01-01 02:00:00     30
2025-01-01 03:00:00     40
2025-01-01 04:00:00     50
2025-01-01 05:00:00     60
# 按每 2 小时聚合,取平均值
resampled = df.resample('2H').mean()
print("\nAfter resample('2H').mean():")
print(resampled)
输出:
                     value
2025-01-01 00:00:00   15.0
2025-01-01 02:00:00   35.0
2025-01-01 04:00:00   55.0

示例 2:按天聚合并求和
# 按天聚合,求和
resampled = df.resample('D').sum()
print("\nAfter resample('D').sum():")
print(resampled)
输出:
            value
2025-01-01    210

示例 3:自定义闭合方式与标签位置
# 每两小时一组,右闭合,标签放在右边
resampled = df.resample('2H', closed='right', label='right').mean()
print("\nresample('2H', closed='right', label='right'):")
print(resampled)
输出:
                     value
2025-01-01 02:00:00   15.0
2025-01-01 04:00:00   35.0
2025-01-01 06:00:00   55.0

示例 4:升采样 + 插值填充(ffill
# 按半小时升采样,并向前填充
resampled = df.resample('30T').ffill()
print("\nresample('30T').ffill():")
print(resampled)
输出(部分):
                     value
2025-01-01 00:00:00     10
2025-01-01 00:30:00     10
2025-01-01 01:00:00     20
2025-01-01 01:30:00     20
2025-01-01 02:00:00     30
...

示例 5:使用 on= 指定时间列进行 resample
# 如果时间不是索引而是列
df_reset = df.reset_index()
df_reset.rename(columns={'index': 'timestamp'}, inplace=True)# 使用 on='timestamp' 进行 resample
resampled = df_reset.resample('2H', on='timestamp').mean()
print("\nresample(..., on='timestamp').mean():")
print(resampled)
输出:
                     value
timestamp                 
2025-01-01 00:00:00   15.0
2025-01-01 02:00:00   35.0
2025-01-01 04:00:00   55.0

示例 6:使用 kind='period' 返回 Period 类型
resampled = df.resample('2H', kind='period').mean()
print("\nresample(..., kind='period').mean():")
print(resampled)
输出:
         value
timestamp      
2025-01-01 00:00   15.0
2025-01-01 02:00   35.0
2025-01-01 04:00   55.0

🧠 应用场景
场景说明
时间序列聚合如计算每日/每周/每月的均值、总和等
降采样(Downsampling)将高频率数据转换为低频率(如秒级 → 分钟级)
升采样(Upsampling)将低频率数据转换为高频率(如日级 → 小时级),通常结合 .interpolate().ffill()
缺失值处理在升采样后填充缺失值
可视化准备统一时间粒度便于绘图分析

⚠️ 注意事项
  • 必须确保索引或指定列为 DatetimeIndex 类型;
  • resample() 不会直接返回结果,必须配合聚合函数(如 .mean(), .sum());
  • 支持多种频率规则,如:
    • 'T' / 'min':分钟
    • 'H':小时
    • 'D':天
    • 'W':周
    • 'M':月末
    • 'Q':季度末
    • 'A':年末
  • closedlabel 控制时间区间的划分方式;
  • origin 可控制时间窗口起点;
  • offset 可设置时间窗口偏移(如从 1:30 开始);
  • on= 可用于对非索引的时间列进行 resample。

✅ 总结对比
方法是否聚合是否支持升采样是否支持降采样是否支持非索引时间列
.resample()✅(通过 on=
.asfreq()
.rolling()
.groupby(pd.Grouper(freq='D'))

📈 频率规则参考表(常用)
规则含义
'T' / 'min'每分钟
'H'每小时
'D'每天
'W'每周(默认周日为一周开始)
'M'每月最后一天
'Q'每季度最后一天
'A'每年最后一天
'MS'每月初第一天
'QS'每季度初第一天
'AS'每年初第一天

✅ 推荐组合使用方式
# 常见降采样 + 聚合
df.resample('D').mean()# 常见升采样 + 填充
df.resample('T').ffill()  # 每分钟向前填充
df.resample('T').interpolate('linear')  # 线性插值

如果你希望对时间序列进行降采样统计、升采样插值、或统一时间粒度resample() 是非常强大且灵活的工具,是时间序列分析中的核心方法之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/912080.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/912080.shtml
英文地址,请注明出处:http://en.pswp.cn/news/912080.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动驾驶nuPlan数据集-入门使用和可视化操作

文章目录 前言一、nuPlan 数据集下载及环境安装根据个人安装的路径将以下内容写入./bashrc 中二、跑通场景可视化总结 前言 自动驾驶行业知识点太多,不进则退,上班就得学习,天上掉金砖砸我脚好了 参考文档 参考1 一、nuPlan 数据…

ApplovinMax接入Unity(包括我自己踩的一些坑)

前言 ApplovinMax是一个广告聚合平台,他会自带自己的Applovin平台广告,在这个插件上面你可以下载其他的聚合渠道,与谷歌的Admob比较相似。都是广告聚合平台。 一. ApplovinMax SDK插件的导入 1.下载插件集成 | SDK 集成指南 | MAX | Suppo…

linux系统执行过程中的5种特殊情况

正在执行的用户态X切换用户态进程Y的过程为系统中常用的情况,但并非不能完全准确地反应系统的全部执行场景,还有一些场景比较特殊,主要包括以下5种情况 一.内核线程之间通过中断处理过程中的调度时机发生进程切换,与一般的情况非常…

9. 元素拖拽

元素拖拽 API 介绍 1. 拖放过程 整个拖放过程中,存在两个关键元素:拖拽元素、放置元素 拖拽元素:被拖拽的元素 drag:元素被拖拽时触发,从开始拖拽到拖拽结束前整个过程会一直持续的触发dragstart:元素被…

用来提升同花顺软件进程优先级的C#程序

为了提高炒股软件同花顺的运行速度,消除卡顿,编写一个C#程序,来设置同花顺进程的优先级。 using System; using System.Diagnostics; using System.Security.Principal;namespace ProcessPrioritySetter {class Program{static void Main(st…

linux初阶---一些指令

一.快速认识6-8个简单指令 1.pwd pwd指令是用来查看用户当前所处在的目录(目录的概念在理解上可以等效为文件夹)。 (1)在windows系统中我们通过文件路径表示唯一的文件,在linux中也是一样的,所以pwd是一个很…

全国产传感器外壳的综合分析:材料选择、考量因素与尺寸精度影响

全国产传感器作为现代工业、科研、生活等领域的 “感知触角”,其外壳的性能与质量直接关乎设备的稳定性、可靠性与使用寿命。从材料选型、关键考量因素到尺寸精度的影响,每个环节都需精细把控。 一、全国产传感器外壳材料的多元选择 全国产传感器外壳材…

本地缓存Caffeine详解(含与Spring Cache集成)

目录 一、介绍 二、Caffeine核心原理与架构设计 2.1 存储引擎与数据结构 2.2 缓存淘汰策略 2.3 并发控制机制 三、入门案例 3.1 引入依赖 3.2 测试接口 3.3 小结 四、Caffeine常用方法详解 4.1 getIfPresent 4.2 get 4.3 put 4.4 putAll 4.5 invalidate 4.6 inv…

论特定领域软件架构

20250413-作 题目 特定领域软件架构DSSA(Domain Specific Software Architecture)就是在一个特定应用领域中为一组应用提供组织结构参考的标准软件体系结构。对DSSA 研究的角度、关心的问题不同导致了对DSSA 的不同定义。DSSA 的必备特征如下。 一…

iOS 远程调试与离线排查实战:构建非现场问题复现机制

iOS开发者都知道,调试最怕两个字:“偶发”。用户说App闪退了,你点了十遍也没问题;测试说功能卡顿了,你抓日志时它又顺滑如新。最麻烦的是,这种“现场问题”往往在你连接不到用户设备时发生。 面对这种情况…

SpringBoot -- 整合 Swagger3

8.SpringBoot3 整合 Swagger3 由于目前主流的开发模式是前后端分离开发。所以前后端的交互需要通过一个 API&#xff08;开发接口&#xff09; 来规范。而这个接口的开发是由后端程序员编写的。“网站式 API 文档” 1.导入依赖 <!-- 引入swagger3(springdoc)的依赖--> …

A Machine Learning Approach for Non-blind Image Deconvolution论文阅读

A Machine Learning Approach for Non-blind Image Deconvolution 1. 研究目标与实际意义2. 创新方法与模型设计2.1 核心思路2.2 正则化反演:理论与公式2.2.1 退化模型2.2.2 正则化目标函数2.2.3 傅里叶域闭式解2.3 MLP去伪影:架构与训练2.3.1 MLP架构设计2.3.2 训练流程2.3.…

微信小程序<rich-text>支持里面图片点击放大

使用<rich-text>渲染类似下面的html代码&#xff1a; <div stylecolor: red>宠物友好<br/>xxx提供宠物友好服务&#xff0c;具体请见下图<br/></div> <img srchttps://xxx.com/xxx1.png width100%/> <img srchttps://xxx.com/xxx2.png…

BVH 文件是一种用于记录 3D 动画数据的文件格式,常用于 3D 建模和动画制作。以下是对这个 BVH 文件的逐行解读

BVH 文件是一种用于记录 3D 动画数据的文件格式&#xff0c;常用于 3D 建模和动画制作。以下是对这个 BVH 文件的逐行解读&#xff1a; HIERARCHY ROOT Hips { OFFSET 0 0 0 CHANNELS 6 Xposition Yposition Zposition Zrotation Xrotation Yrotation JOINT LeftUpLeg { OFFSE…

C语言开发:Onvif(一)

根据ONVIF官网 的介绍&#xff1a; ONVIF是一个开放的安防行业组织&#xff0c;致力于为安防行业提供和促进标准化开放接口&#xff0c;以实现IP网络安防产品和服务的有效互操作性。 在具体实现上&#xff0c;ONVIF使用了Web Service的方式&#xff0c;设备通过WSDL定义的接口…

中科米堆三维扫描仪耳机3D扫描尺寸测量数字化建模

当下&#xff0c;耳机已从单纯的音频输出设备进化为集娱乐、健康、办公于一体的智能穿戴终端。相关数据显示&#xff0c;2025年全球智能个人音频设备出货量突破4.55亿台&#xff0c;中国以22%的增速领跑全球&#xff0c;其中开放式耳机&#xff08;OWS&#xff09;出货量占比达…

学习接口自动化框架pytest有哪些好处?

学习 pytest 作为接口自动化测试框架&#xff0c;具有以下显著优势&#xff0c;能大幅提升测试效率和质量&#xff1a; Pytest自动化测试教程&#xff0c;自动化必备之Pytest测试框架训练营&#xff0c;只需一小时速成&#xff0c;学会直接上手实操&#xff01; 1. 代码简洁&…

LinuxBridge的作用与发展历程:从基础桥接到云原生网络基石

LinuxBridge作为Linux网络虚拟化的核心组件&#xff0c;已悄然支撑互联网基础设施20余年。它不仅是虚拟机网络连接的桥梁&#xff0c;更是容器网络、云原生架构的隐形支柱。 一、LinuxBridge的核心作用剖析 1. 二层网络虚拟化的实现者 本质功能&#xff1a;模拟物理交换机行为…

探讨 SYSCFG 时钟对 ADC 采样的影响

探讨 SYSCFG 时钟对 ADC 采样的影响 在嵌入式系统开发中&#xff0c;对于 GD32F4 系列微控制器&#xff0c;理解 SYSCFG 时钟与 ADC 采样之间的关系至关重要。 以下是详细分析&#xff1a; 一、SYSCFG 时钟对 ADC 采样过程的基础性作用 1. 提供采样时钟信号 ADC 采样需要时钟…

Spring Boot 项目实训 - 图书信息网站

文章目录 1. 实训目的2. 系统设计3. 运行演示4. 实现步骤4.1 创建数据库与表4.2 创建Spring Boot项目4.3 创建实体类4.4 创建映射器接口4.5 编写应用配置文件4.6 测试映射器接口4.7 创建服务类4.8 创建控制器4.9 准备静态资源4.10 创建模板页面4.11 测试整个项目 5. 实训总结 1…