DAY 59 经典时序预测模型3

知识点回顾:

  1. SARIMA模型的参数和用法:SARIMA(p, d, q)(P, D, Q)m
  2. 模型结果的检验可视化(昨天说的是摘要表怎么看,今天是对这个内容可视化)
  3. 多变量数据的理解:内生变量和外部变量
  4. 多变量模型
    1. 统计模型:SARIMA(单向因果)、VAR(考虑双向依赖)
    2. 机器学习模型:通过滑动窗口实现,往往需要借助arima等作为特征提取器来捕捉线性部分(趋势、季节性),再利用自己的优势捕捉非线性的残差
    3. 深度学习模型:独特的设计天然为时序数据而生

作业:由于篇幅问题,无法实战SARIMAX了,可以自己借助AI尝试尝试,相信大家已经有这个能力了。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.stattools import adfuller
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.statespace.sarimax import SARIMAX
import warnings
import itertools
warnings.filterwarnings('ignore')
# 显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False# 1. 加载数据
url = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv'
df = pd.read_csv(url, header=0, index_col=0, parse_dates=True)
df.columns = ['Passengers']# 2. 划分训练集和测试集(保留最后12个月作为测试)
train_data = df.iloc[:-12]
test_data = df.iloc[-12:]print("--- 训练集 ---")
print(train_data.tail()) # 观察训练集最后5行
print("\n--- 测试集 ---")
print(test_data.head()) # 观察测试集前5行
# 3. 可视化原始数据
plt.figure(figsize=(12, 6))
plt.plot(train_data['Passengers'], label='训练集')
plt.plot(test_data['Passengers'], label='测试集', color='orange')
plt.title('国际航空乘客数量 (1949-1960)')
plt.xlabel('年份')
plt.ylabel('乘客数量 (千人)')
plt.legend()
plt.show()

# 进行季节性差分 (D=1, m=12)
seasonal_diff = df['Passengers'].diff(12).dropna()
# 再进行普通差分 (d=1)
seasonal_and_regular_diff = seasonal_diff.diff(1).dropna()# 绘制差分后的数据
plt.figure(figsize=(12, 6))
plt.plot(seasonal_and_regular_diff)
plt.title('经过一次季节性差分和一次普通差分后的数据')
plt.show()# ADF检验
result = adfuller(seasonal_and_regular_diff)
print(f'ADF Statistic: {result[0]}')
print(f'p-value: {result[1]}') # p-value越小,越说明数据平稳

 

# 绘制ACF和PACF图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))
plot_acf(seasonal_and_regular_diff, lags=36, ax=ax1) # 绘制36个时间点
plot_pacf(seasonal_and_regular_diff, lags=36, ax=ax2)
plt.show()

 

手动的超参数搜索:

# 固定已知参数
d = 1           # 非季节性差分阶数
D = 1           # 季节性差分阶数
m = 12          # 季节性周期(月度数据为12)# 定义待搜索的参数范围
p = q = range(0, 3)  # 非季节性参数 p和q取0-2
P = Q = range(0, 2)  # 季节性参数 P和Q取0-1# 生成所有可能的参数组合
pdq = list(itertools.product(p, [d], q))  # d固定为1
seasonal_pdq = [(x[0], D, x[2], m) for x in list(itertools.product(P, [D], Q))]  # D固定为1# 修正列名引用(假设数据列名为'Passengers')
train_column = 'Passengers'  # 请根据实际数据列名调整# 初始化最佳参数和最小AIC
best_aic = float('inf')
best_pdq = None
best_seasonal_pdq = None
best_model = Noneprint("开始网格搜索最佳SARIMA参数...")# 网格搜索最佳参数
for param in pdq:for param_seasonal in seasonal_pdq:try:# 拟合SARIMA模型model = SARIMAX(train_data[train_column],order=param,seasonal_order=param_seasonal,enforce_stationarity=False,  # 放宽平稳性约束enforce_invertibility=False, # 放宽可逆性约束disp=False)# 使用优化的拟合方法results = model.fit(method='bfgs',  # 使用BFGS优化算法maxiter=200,    # 增加最大迭代次数disp=False)# 打印当前参数组合及AICprint(f'SARIMA{param}x{param_seasonal} - AIC: {results.aic:.2f}')# 更新最佳参数if results.aic < best_aic:best_aic = results.aicbest_pdq = parambest_seasonal_pdq = param_seasonalbest_model = resultsexcept Exception as e:print(f'SARIMA{param}x{param_seasonal} 拟合失败: {str(e)}')continue
# 输出最佳模型
if best_pdq:print(f"\n最佳模型: SARIMA{best_pdq}x{best_seasonal_pdq} - AIC: {best_aic:.2f}")final_model = SARIMAX(train_data[train_column],order=best_pdq,seasonal_order=best_seasonal_pdq,enforce_stationarity=False,enforce_invertibility=False)final_results = final_model.fit(disp=False)

 

# 检查是否找到有效模型
if best_model is not None:print(f'\n最佳模型: SARIMA{best_pdq}x{best_seasonal_pdq} - AIC: {best_aic:.2f}')# 打印最佳模型摘要print(best_model.summary())# 绘制模型诊断图best_model.plot_diagnostics(figsize=(15, 10))plt.tight_layout()plt.show()else:print("\n未能找到合适的SARIMA模型。请检查:")print("1. 数据列名是否正确(当前使用:", train_column, ")")print("2. 数据是否包含缺失值或异常值")print("3. 尝试进一步调整参数范围")print("4. 考虑使用其他时间序列模型")

 

# 1. 预测测试集
forecast = final_results.get_forecast(steps=len(test_data))
forecast_mean = forecast.predicted_mean
forecast_ci = forecast.conf_int()# 2. 评估模型
from sklearn.metrics import mean_squared_error
import numpy as npmse = mean_squared_error(test_data[train_column], forecast_mean)
rmse = np.sqrt(mse)
print(f'测试集 MSE: {mse:.2f}')
print(f'测试集 RMSE: {rmse:.2f}')# 3. 绘制预测结果
plt.figure(figsize=(12, 6))
plt.plot(train_data.index, train_data[train_column], label='训练数据')
plt.plot(test_data.index, test_data[train_column], label='真实值', color='orange')
plt.plot(test_data.index, forecast_mean, label='预测值', color='red')
plt.fill_between(forecast_ci.index,forecast_ci.iloc[:, 0],forecast_ci.iloc[:, 1],color='pink', alpha=0.5, label='95%置信区间')
plt.title('SARIMA模型预测 vs. 真实值')
plt.xlabel('日期')
plt.ylabel('乘客数量 (千人)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

 

@浙大疏锦行 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913073.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913073.shtml
英文地址,请注明出处:http://en.pswp.cn/news/913073.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java中agent的作用

一 java中agent1.1 agent-javaagent 是 Java 虚拟机 (JVM) 提供的一个启动参数&#xff0c;用于在 Java 程序 main 方法执行之前&#xff0c;加载一个特殊的 Java 代理程序&#xff08;Java Agent&#xff09;。它的核心作用是对运行中的 Java 程序进行字节码层面的动态修改、监…

[C/C++内存安全]_[中级]_[如何避免数组访问越界]

场景 C/C的标准在C26以前还没支持内存安全的访问连续内存的类或特性。在开发分析内存数据或文件数据的程序时&#xff0c;经常需要把一段内存数据复制到另一个堆空间里。 这时目标内存空间由于起始地址的移动&#xff0c;剩余大小的计算错误&#xff0c;经常会导致访问越界错误…

rabbitmq 与 Erlang 的版本对照表 win10 安装方法

win10 64位系统 安装的版本 otp_win64_27.3.3.exe rabbitmq-server-4.1.1.exe rabbitmq 与 Erlang 的版本对照表 Erlang Version Requirements This guide covers Erlang/OTP version requirements https://www.rabbitmq.com/docs/which-erlang Erlang 28 is not currently…

kali安装教程

kali教程 我下载的是kali的集成环境&#xff0c;可以直接进行打开&#xff0c;无需进行安装。 Get Kali | Kali Linux&#xff0c; 官网下载路径 直接按enter键 安装完成 生成一个小皮安装链接 会给你生成一个外网和内网地址&#xff0c; 可以进行浏览 点击我同意这个协议…

微信小程序入门实例_____快速搭建一个快递查询小程序​

&#x1f337;&#x1f337;之前几篇博文我们一起开发了天气查询、单词速记和待办事项小程序&#xff0c;这次我们来对生活中常用的功能 —— 快递查询来探索相关的小程序。网购已经成为大家生活的一部分&#xff0c;有了自己的快递查询小程序&#xff0c;不用切换多个应用&…

【防火墙基础之传统墙到 UTM 到 NGFW 再到 AI 的变化】

防火墙技术演进与未来趋势&#xff1a;从传统防御到AI驱动的智能安全 防火墙技术历经数十年发展&#xff0c;已从早期的简单包过滤演进为融合AI的智能安全平台。当前&#xff0c;传统爬虫防护技术如频率限制和人机校验已无法应对现代攻击&#xff0c;而全面风控体系通过多维协同…

【仿muduo库实现并发服务器】Poller模块

仿muduo库实现并发服务器 1.Poller模块成员变量创建epoll模型对于一个描述符添加或修改事件监控对于一个描述符移除事件监控启动epoll事件监控&#xff0c;获取所有活跃连接 1.Poller模块 Poller模块主要是对任意的描述符进行IO事件监控。 它是对epoll的封装&#xff0c;可以让…

小程序学习笔记:使用 MobX 实现全局数据共享,实例创建、计算属性与 Actions 方法

在小程序开发过程中&#xff0c;组件间的数据共享是一个常见且关键的问题。今天&#xff0c;我们就来深入探讨一下如何在小程序中实现全局数据共享&#xff0c;借助 MobX 相关的包&#xff0c;让数据管理变得更加高效便捷。 什么是全局数据共享 全局数据共享&#xff0c;也被…

观测云 × AWS SSO:权限治理可观测实践

AWS IAM Identity Center 介绍 AWS IAM Identity Center&#xff08;原 AWS Single Sign-On&#xff09;是 AWS 提供的一项云原生身份与访问管理&#xff08;IAM&#xff09;服务&#xff0c;旨在集中简化多 AWS 账户、多业务应用的安全访问控制。 观测云 观测云是一款专为 …

springboot整合配置swagger3

一. swagger3介绍 Swagger 3 是基于 OpenAPI 规范 3.0 的 API 文档工具&#xff0c;用于设计、构建和消费 RESTful API。它通过标准化描述 API 的接口、参数、响应等元数据&#xff0c;实现以下核心功能&#xff1a; 自动生成交互式文档API 测试与调试代码生成&#xff08;客…

RabbitMQ 4.1.1初体验

为什么选择 RabbitMQ&#xff1f;* RabbitMQ 是一款可靠且成熟的消息代理和流处理中间件&#xff0c;可轻松部署在云端、本地数据中心或您的开发机上&#xff0c;目前已被全球数百万用户使用。 优势在哪里 互操作性 RabbitMQ 支持多种开放标准协议&#xff0c;包括 AMQP 1.0 和…

【精华】QPS限流等场景,Redis其他数据结构优劣势对比

下面是一个详细的 Redis 数据结构对比表&#xff0c;比较它们在实现 QPS 限流 / 滑动窗口统计 / 查定比监控等场景中的适用性&#xff1a; ✅ Redis 数据结构对比表&#xff08;用于接口限流 / QPS 监控&#xff09; 维度String INCR 固定窗口List 滑动窗口Hash 计数器ZSet 滑…

顶层设计:支持单元化、灰度化的应用架构

一、顶层目标 业务连续性&#xff1a;任何单元故障不影响整体弹性伸缩&#xff1a;根据业务流量横向扩展灵活灰度&#xff1a;任何发布都可逐步平滑上线成本可控&#xff1a;单元化带来的资源冗余最小 二、核心理念 设计目标核心理念单元化垂直拆分&#xff0c;分而治之&…

MacOS Safari 如何打开F12 开发者工具 Developer Tools

背景 If you’re a web develper, the Safari Develop menu provides tools you can use to make sure your website works well with all standards-based web browsers. 解决 If you don’t see the Develop menu in menu bar, Choose Safari > settingsClick Advanced…

2025—暑期训练一

A 本题描述了一个最优路径规划问题的解法&#xff0c;核心思路是利用数轴上区间覆盖的特性&#xff0c;将问题简化为两个端点的访问问题。以下是关键点的详细解析&#xff1a; 核心观察 区间覆盖特性 给定的位置数组 x1, x2, ..., xn 是严格递增的&#xff08;即 x1 < x2 …

ubuntu 18.04配置镜像源

配置镜像源的主要作用是优化软件下载速度、提升系统更新稳定性&#xff0c;并确保软件包获取的可靠性 我这里配置阿里云镜像源 镜像的具体内容参考此文: 文章链接 以防万一,先备份一下 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak然后开始修改 sudo nano /etc…

RecyclerView中跳转到最后一条item并确保它在可视区域内显示

在RecyclerView中跳转并显示最后一条Item 要在RecyclerView中跳转到最后一条item并确保它在可视区域内显示&#xff0c;可以使用以下几种方法&#xff1a; 1. 使用scrollToPosition()方法&#xff08;基本方法&#xff09; recyclerView.scrollToPosition(adapter.getItemCo…

ubuntu22 桌面版开启root登陆

一、先创建root sudo passwd root 二、注释代码 vim /etc/pam.d/gdm-password vim/etc/pam.d/gdm-autologin 都注释 auth required pam_succeed_if.so user ! root quiet_success 三、修改profile文件 vim /root/.profile 注释掉 mesg n 2&#xff1e; /dev/null || true 插入新…

docker学习二天之镜像操作与容器操作

镜像的一般运用过程 一、镜像&#xff08;Image&#xff09;操作 镜像是容器的基础模板&#xff0c;存储在本地或远程仓库中。 1. 镜像拉取 # 从指定镜像源拉取 docker pull docker.m.daocloud.io/library/nginx 2. 镜像查看 # 列出本地镜像 docker images # 或 docker image…

多个参数用websocket 向io 服务器发送变量,一次发一个,并接收响应

问题&#xff1a;多个参数用websocket 向io 服务器发送变量&#xff0c;一次发一个&#xff0c;并接收响应&#xff0c;如果是多个变量&#xff0c;但还是需要一个个发送&#xff0c;应该怎么实现&#xff0c;思路是什么样子的呢&#xff1f;用数组的话&#xff0c;应该怎么用&…