ar_model.AutoReg 模型通过应用以下元素来估计参数

        条件最大似然(CML)估计量:这是一种涉及条件对数似然函数最大化的方法,据此认为已知的参数要么由理论假设固定,要么更常见地由估计值代替(LewiseBeck,Bryman和Liao 2004)

并支持以下元素:

        外源回归变量(或独立变量,即对目标变量的值有影响的变量):更具体的说,支持ARX模型(具有外源变量的自回归)。ARX模型和相关模型也可以用arima.ARIMA类和SARMAX类。

        季节性效应:定义为时间序列中的系统和日历相关效应。

python 支持使用statsmodels库中的AutoReg模型进行自回归建模(statsmodels.org/stable/generated/statsmodels.tsa.ar_model.AutoReg.html),如表4.4 所总结。

        

          

        

        可以使用这个包创建模型AutoReg,然后调用fit()函数在数据集上训练它。下面是如何将这个包应用到ts_data集中。

        AutoReg支持与普通最小二乘(OLS)模型相同的协方差估计。在下面的示例中使用cov_type='HC0', 这是White的协方差估计量(#TODO)White检验(#TODO)用于检测回归分析中的异方差误差:White检验的原假设是误差的方差相等。虽然参数估计值相同,但所有依赖于标准差的量都会改变(White 1980)。

        通过使用plot_predict, 可以对预测可视化。下面给出了大量的预测,显示了模型捕捉到的字符串季节性:

        

        最后,我们可以测试AutoReg()函数的预测能力:使用predict方法从结果实例中生成预测。默认情况下会生成静态预测,这是单步预测。生成多步预测需要使用dynamic=True。

        在下面的示例代码中,将predict方法应用于ts_data集上。为训练集准备数据包括以下步骤:

        1.定义训练集和测试集的开始日期。

        2.过滤原始数据集,使其仅包含为训练集保留的时间段。

        3.缩放时间序列,使值落在区间(0,1)内。对于这个操作,我们将使用MinMax-Scaler(). 这是一种估计量,它对每个特征分别进行缩放和转换,使其在训练集的给定范围内,例如子啊0,1之间。

        

        对应代码:(待补充 #TODO)

4.2 移动平均

        移动平均技术利用回归方法中的先前预测误差来预测下一个时间戳的未来观测值:每个未来观测值可以被认为是先前预测误差的加权移动平均。

        与自回归技术一起,移动平均方法是更常规的自回归移动平均差分自回归移动平均模型的重要元素,其呈现更复杂的随机配置。

        移动平均模型自回归模型非常相似:自回归模型代表过去观测值的线性组合,而移动平均模型代表过去误差项的组合。data scientist 通常将移动平均模型应用于时间序列数据,因为他们非常擅长通过将模型拟合到误差项来直接解释误差过程中隐藏的或不规则的模式。

4.3 自回归移动平均

        自回归移动平均(ARMA)模型在时间序列建模中一直发挥着关键作用,因为它们的线性结构有助于线性预测的实质性简化(Zhang等2015)。
自回归移动平均方法由两部分组成:
        自回归
        移动平均模型
        与自回归和移动平均模型相比,ARMA模型提供了最有效的平稳时间序列线性模型,因为它们能够用最少的参数对未知过程建模(Zhang等2015)。
        特别地,ARMA模型用于根据两个多项式来描述每周平稳随机时间序列。第一个多项式用于自回归,第二个用于移动平均。这种方法通常被称为ARMA(p,q)模型,其中:

                

        在这里,我们将看到如何根据自回归、MA(q)和ARMA(p,q)过程来模拟时间序列,以及如何基于从ACF和PACF收集的见解将时间序列模型拟合到数据。

        Python使用statsmodels中的ARMA()函数来支持ARMA模型的实现。statsmodels库提供了ARMA()类的定义和参数,如表4.6所示。

        

        下一节将学习如何利用自回归和自回归移动平均,用ts_data_load集构建差分自回归移动平均模型。

 4.4 差分自回归移动平均

        差分自回归移动平均(ARIMA)模型被认为是更简单的自回归移动平均(ARMA)模型的发展,并包括差分的概念。

        的确,自回归移动平均(ARMA)和差分自回归移动平均(ARIMA)呈现出许多相似的特征:他们的元素是相同的,在某种意义上说,它们都是利用了一般自回归AR(p)  和 一般移动平均模型MA(q)。正如之前所了解的,AR(p)模型使用时间序列中的先前值进行预测,而MA(q)使用序列平均值和先前误差进行预测(Petris,Petrone 和 Campagnoli 2009)。

        ARMA 和 ARIMA方法之间的主要区别是积分和差分的概念。ARMA模型是一个平稳模型,它非常适合平稳时间序列(其统计属性,如均值、自相关和季节性,不依赖于观测到该序列的时间)。

        可以通过差分技术(例如,从时间t-1观测到的值减去时间t观测到的值)使时间序列平稳。估计时间序列平稳性需要多少非季节性差异的过程被称为积分(I)或积分法。

        ARIMA模型有三个主要组成部分,分别表示为p,d,q;在python中,可以为每个组件分配整数值,以指示你需要应用的特定ARIMA模型。这些参数定义如下:

        p代表ARIMA模型中包含的滞后变量的数量,也称为滞后顺序。

        d代表时间序列数据集中原始值的差异次数,也称为差异程度。

        q表示移动平均窗口的大小,也称为移动顺序平均。

        deepseek解释如下:

现在让我们开看看python中ARIMA模型的一个扩展,叫做SARIMAX,它代表具有外源因素的季节性差分自回归移动平均模型。当data scientist必须处理具有季节性周期的时间序列数据集时,他们通常会应用SARIMAX。此外,SARIMAX模型支持季节性外源因素,因此,他们不仅需要ARIMA所要求的p,d,q参数,还需要季节性方面的另一组p,d和q参数以及参数s,s是时间序列数据集中季节性周期的周期性。

辅助理解:

                

python通过statsmodels库支持SARIMAX()类,如表4.7所示:

        

        statsmodels库为SARIMAX()类提供了定义和参数。

4.5 自动化机器学习

        本节,将学习如何在Azure机器学习中使用自动化机器学习语言来训练时间序列预测回归模型,设计预测模型类似于使用自动化机器学习语言建立典型的回归模型;

        

4.6 总结

        在本章中,学习了如何使用自回归方法和Azure机器学习中的自动化机器学习方法来训练时间序列预测回归模型。
具体来说,我们研究了以下方法:
        自回归。该时间序列技术假设下一个时间戳的未来观测值与前一个时间戳的观测值呈线性关系。
        移动平均。该时间序列技术利用回归方法中以前的预测误差来预测下一个时间戳的未来观测值。与自回归技术一起,移动平均方法是更一般的自回归移动平均和差分自回归移动平均模型(它们呈现更复杂的随机配置)的关键元素。

        自回归移动平均。该时间序列技术假设下一个时间戳的未来观测值可以表示为先前时间戳的观测值和残差的线性函数。

        差分自回归移动平均。该时间序列技术假设下一个时间戳的未来观测值可以表示为先前时间戳的差分观测值和残差的线性函数。
        自动化机器学习。该时间序列技术组合不同的机器学习算法进行时间序列预测同时为场景执行最佳模型选择、超参数调整和特征工程。


在第5章中,我们将学习如何在时间序列场景中使用深度学习方法。

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85441.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85441.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85441.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL(84)如何配置MySQL防火墙?

MySQL防火墙(MySQL Enterprise Firewall)是一种MySQL企业版特性,用于保护数据库免受SQL注入和其他恶意活动的攻击。它通过学习和监控合法SQL语句,创建一个允许列表,从而阻止未在列表中的SQL语句。 1. 启用MySQL防火墙…

优化 Python 爬虫性能:异步爬取新浪财经大数据

一、同步爬虫的瓶颈 传统的同步爬虫(如requestsBeautifulSoup)在请求网页时,必须等待服务器返回响应后才能继续下一个请求。这种阻塞式I/O操作在面对大量数据时存在以下问题: 速度慢:每个请求必须串行执行&#xff0…

Visual Studio Code (VSCode) Python 开发环境配置完整指南

一、安装准备 1. 安装 VSCode 官网下载: Visual Studio Code - Code Editing. Redefined安装时建议勾选: "添加到PATH" (方便终端调用)"注册为受支持的文件类型编辑器"2. 安装 Python 官网下载: Download Python | Python.org安装时勾选: "Add Pytho…

智能数据标签引擎:企业级分类分级与动态管控实践

在数字化转型浪潮中,企业数据量呈爆发式增长,数据的多样性和复杂性也不断提升。如何对海量数据进行高效分类分级,并实施动态管控,成为企业释放数据价值、保障数据安全的关键挑战。智能数据标签引擎应运而生,它通过引入…

Redis(1)——RDB持久化

在追求极致性能的 Redis 世界里,数据安全是永恒的主题。作为内存数据库,Redis 重启或宕机意味着数据丢失的风险。RDB (Redis Database) 持久化,又称快照持久化,是 Redis 提供的最经典、最高效的数据落地方案之一。它通过生成某个时…

深度剖析无感刷新Token:领码SPARK平台赋能微服务认证的智能实践

摘要 在现代微服务架构与数字化转型大潮中,用户身份认证的连续性与安全性尤为关键。无感刷新Token技术通过智能的双Token机制,确保用户访问凭证在不打扰用户的前提下自动续期,避免因Token过期导致的频繁登录中断。本文结合领码SPARK融合平台的…

声网对话式 AI:开启我的编程进阶之旅

转行学习编程时,复杂的代码逻辑常让我无从下手,直到遇见声网对话式AI。它像一位耐心的导师,不仅用通俗易懂的语言帮我理解Python循环嵌套等难点,还提供实际代码示例。当我开发学生成绩管理系统时,它甚至直接生成框架代…

精准护理,点亮进行性核上性麻痹患者生活希望

进行性核上性麻痹(PSP)是一种罕见的神经系统变性疾病,主要表现为姿势平衡障碍、眼球运动障碍、吞咽困难等症状。科学的健康护理能有效延缓病情进展,提升患者生活质量,可从以下方面着手。 ​在饮食护理上,因…

记录一次 Oracle 表空间不足问题的解决过程

记录一次 Oracle 表空间不足问题的解决过程 6月14日,某医院信息科用户反映无法提交门诊病例,门诊处方也无法开立。其他功能是正常的。考虑可能是与门诊病例有关的表空间用完了。 Oracle表空间的数据文件默认是可以自动增长的,但是单个文件的…

2024 年 11 月公链行业研报:比特币创历史新高引领市场全面上涨

比特币屡创历史新高,主导市场全面上涨,同时 Layer 1 表现强劲,而 Layer 2 格局持续演变。 2024 年 11 月公链研报 作者:Stella L (stellafootprint.network) 数据来源:Footprint Analytics 公链研究页面 2024 年 11…

MAX4622ESE+T双5Ω模拟开关在低失真音频路由中的实测:0.5Ω匹配度如何改善THD性能

一、产品概述:精密信号切换的硬件基石 MAX4622ESET是一款双通道SPDT(单刀双掷)模拟开关,采用5Ω超低导通电阻设计(典型值3Ω),专为高精度信号路由场景优化。其核心价值在于通过单片CMOS架构实现…

高并发秒杀系统(Redis分布式锁优化与库存防超卖实战)

本文通过日活百万级的电商秒杀案例,深度剖析分库分表路由算法在高并发场景下的落地实践。结合Redis分布式锁的优化方案解决库存超卖问题,包含完整架构设计、代码实现及压测数据对比。全文包含12个核心代码片段和8类技术图表,来自线上生产环境…

从loader和plugin开始了解webpack

目录 一、webpack中loader和plugin的区别1. Loader(每个 Loader 是一个函数或对象)2.plugin(每个 Plugin 是一个实例)3.自定义loader和plugin 二、Babel的功能三、Plugin中的compiler和compilation对象1. compiler对象2. compilat…

36-Oracle Statistics Gathering(统计信息收集)

小伙伴们,有没有因为统计信息不准,导致了业务卡顿,各种状况频出,这几天在实践和实操的过程中,时不时就需要进行统计信息的收集。同时统计信息收集的动作也是OCM必考内容。 数据库中的数据是地图,统计信息是…

Linux驱动程序(PWM接口)与超声波测距

一、利用阿里云服务器实现树莓派外网访问(SSH 反向代理) 1. 树莓派端配置 步骤 1:安装 SSH 服务(若未安装) sudo apt-get install openssh-server 步骤 2:创建反向代理连接 -p 22:指定阿里…

Web攻防-XSS跨站文件类型功能逻辑SVGPDFSWFHTMLXMLPMessageLocalStorage

知识点: 1、Web攻防-XSS跨站-文件类型-html&pdf&swf&svg&xml 2、Web攻防-XSS跨站-功能逻辑-postMessage&localStorage 一、演示案例-WEB攻防-XSS跨站-文件类型触发XSS-SVG&PDF&SWF&HTML&XML等 1、SVG-XSS SVG(Scalable Vect…

强大模型通过自我和解进步——Unsupervised Elicitation of Language Models——论文阅读笔记

本周关注的工作是:Unsupervised Elicitation of Language Models 这篇文章通篇体现了这样一件事——香蕉皮大需要香蕉大! 一句话总结 首先注意:这个工作不是面向对齐的,而是写【如何准备】对齐任务的Reward Model需要的数据集的…

Qt—(Qt初识,槽,信号,事件)

一 Qt初识 暂时不写了 我的理解是类似于c#,是一个组件库,不局限是一个组件框架。 二 Qt Core Qt Core 是 Qt 框架的基础模块,提供非 GUI 的核心功能: 核心类:QObject(信号槽机制)、QEvent&…

深度学习——基于卷积神经网络实现食物图像分类【2】(数据增强)

文章目录 引言一、项目概述二、环境准备三、数据预处理3.1 数据增强与标准化3.2 数据集准备 四、自定义数据集类五、构建CNN模型六、训练与评估6.1 训练函数6.2 评估函数6.3 训练流程 七、关键技术与优化八、常见问题与解决九、完整代码十、总结 引言 本文将详细介绍如何使用P…

详细说说分布式Session的几种实现方式

1. 基于客户端存储(Cookie-Based) 原理:将会话数据直接存储在客户端 Cookie 中 实现: // Spring Boot 示例 Bean public CookieSerializer cookieSerializer() {DefaultCookieSerializer serializer new DefaultCookieSerializ…