近年来,已经开发了一些深度学习方法并将其应用于单变量时间预测场景,其中时间序列由在等时间增量上按顺序记录的单个观测数据组成。

5.1 将深度学习用于时间序列预测的原因

        机器学习的目标是提取特征来训练模型。模型将输入数据(例如图片,时间序列或音频)转换为给定的输出(例如字幕、价格值或转录)。深度学习是机器学习算法的子集。它通过经输入数据表示为向量并将其通过一系列线性代数运算转换为给定的输出来学习并提取特征。为了进一步阐明深度学习和机器学习之间的区别,我们首先分别定义这两个研究领域:

        1.机器学习 是一直使用算法来分析数据,从中学习并随后使用此数据对某种现象做出一写预测的实践。这个学习过程通常基于以下步骤:

                a.向算法中填充数据;

                b.使用这些数据来从以前的观测值中学习并训练数据。

                c.运行测试来检查模型是否从以前的观测值中进行了足够的学习并对其性能进行评估。

                d.如果模型表现良好,我们将其部署并投入生产阶段,以供组织中或企业外部的其他利益相关者使用。

                e.最后,使用部署的模型来执行某些自动化的预测任务。

        2.深度学习是机器学习的子集。深度学习算法基于人工神经网络,是一种特定类型的机器学习算法,是因为算法的结构基于人工神经网络。人工神经网络由多个输入、输出和隐藏层组成,其中包含一些单元。一旦部署了深度学习模型,这些单元就可以就将输入数据转换为一些信息,供下一层用于执行某些自动化预测任务。

        深度学习神经网络具有三个主要的内在特性:

        a.深度学习神经网络能够自动从原始数据中学习和提取特征。

        b.深度学习支持多个输入和输出。

        c.循环神经网络,特别是LSTM和门控循环单元(GRU),擅长提取跨越相对较长序列的输入数据中的模式。

        5.1.1 深度学习神经网络能够自动从原始数据中学习和提取特征

        5.1.2 深度学习支持多个输入和输出

        5.1.3 循环神经网络擅长从输入数据中提取模式

5.2 基于循环神经网络的时间序列预测

        5.2.1 循环神经网络 RNN

        5.2.2 长短期记忆 LSTM

        LSTM:长短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。

        RNN的问题:存在梯度爆炸和消失的问题,对于长距离的句子的学习效果不好。

        LSTM网络架构:

        LSTM细胞由输入门、遗忘门、输出门和单元状态组成。

        下图展示了应用上一个时刻的输出h_t-1和当前的数据输入x_t,通过遗忘门得到f_t的过程。(下面的一组原图来源:Understanding LSTM Networks)

        

        下图展示了应用上一个时刻的输出h_t-1和当前的数据输入x_t,通过输入门得到i_t,以及通过单元状态得到当前时刻暂时状态C~t的过程。

        下图展示了应用上一个细胞结构的单元状态C_t-1、遗忘门输出f_t、输入门输出i_t以及单元状态的输出C~t,得到当前细胞的状态C_t的过程。

        下图展示了应用上一个时刻的输出h_t-1和当前的数据输入x_t,通过输出门得到o_t的过程,以及结合当前细胞的单元状态C_t和o_t得到最终的输出h_t的过程。

        5.2.3 门控循环单元 GRU(Gated Recurrent Unit)

        GRU是传统RNN的变体,同LSTM一样neg有效捕捉长序列之间的语义关联,缓解梯度消失或爆炸现象。同时它的结构和计算要比LSTM更简单,它的核心结构可以分为两个部分去解析:

        更新门

        用于控制上一时间步的隐藏状态是否对当前时间步的输入进行更新。更新门的作用类似于LSTM中的遗忘门和输入门的组合,它决定了新信息进入当前隐藏状态的比例,以及保留多少旧信息。

        重置门

        用于控制如何使用历史信息。当重置门接近0时,它几乎会忽略掉所有的历史信息,而只关注当前输入。这有助于模型在处理新的输入时能够“忘记”不相关的信息,从而更好地捕捉序列中的长期依赖关系。

        内部结构图:

                

        结构解析图:

            

        GRU的更新门和重置门结构图    :

                

        GRU的优点:

         GRU和LSTM作用相同, 在捕捉长序列语义关联时, 能有效抑制梯度消失或爆炸, 效果都优于传统RNN且计算复杂度相比LSTM要小.

        GRU的缺点:

        GRU仍然不能完全解决梯度消失问题, 同时其作用RNN的变体, 有着RNN结构本身的一大弊端, 即不可并行计算, 这在数据量和模型体量逐步增大的未来, 是RNN发展的关键瓶颈.

5.3 如何开发用于时间序列的GRU和LSTM

        5.3.1 Keras

        5.3.2Tensorflow

        5.3.3 单变量模型

        5.3.4 多变量模型

5.4 总结

                

        

GRU参考:【机器学习】探索GRU:深度学习中门控循环单元的魅力-腾讯云开发者社区-腾讯云

LSTM参考:   最简单的LSTM讲解,多图展示,源码实践,建议收藏-腾讯云开发者社区-腾讯云长短期记忆神经网络(LSTM)介绍以及简单应用分析「建议收藏」-腾讯云开发者社区-腾讯云

        

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/910214.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/910214.shtml
英文地址,请注明出处:http://en.pswp.cn/news/910214.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【软考高级系统架构论文】论软件设计方法及其应用

论文真题 软件设计 (Software Design,SD) 根据软件需求规格说明书设计软件系统的整体结构、划分功能模块、确定每个模块的实现算法以及程序流程等,形成软件的具体设计方案。软件设计把许多事物和问题按不同的层次和角度进行抽象,将问题或事物进行模块化分解,以便更容易解决…

什么是水平扩展

什么是水平扩展 在现代系统架构设计中,可扩展性(Scalability)是衡量系统面对业务增长时应对能力的重要指标。而“水平扩展”(Horizontal Scaling),又称为“横向扩展”或“扩容节点”,正是应对高…

掌握openpyxl:Excel自动化处理全指南

openpyxl基础用法 openpyxl 是一个用于处理 Excel 文件(.xlsx/.xlsm)的 Python 库,支持读取、修改和创建 Excel 文档。以下是其常见用法的详细介绍: 一、基础操作:打开与保存文件 from openpyxl import load_workbo…

FastGPT:开启大模型应用新时代(4/6)

摘要:FastGPT是一种基于大语言模型(LLM)的知识库问答系统,致力于提供高效、精准的自然语言处理服务。它允许用户构建本地知识库以增强AI的理解能力,通过将用户的问题与知识库信息匹配推理,生成有针对性的回…

在MyBatis中$和#有什么区别

在 MyBatis 中,${} 和 #{} 是两种处理 SQL 参数的占位符,它们在实现机制、安全性、使用场景上存在显著差异。以下是详细对比: 核心区别对比 特性#{}${}底层机制预编译占位符(PreparedStatement)字符串直接替换安全性…

湖北理元理律师事务所债务优化方案:平衡还款与生活的法律实践

在个人债务问题日益突出的当下,如何科学规划还款路径成为社会性难题。湖北理元理律师事务所基于多年实务经验,提出“可持续债务优化”模型,其核心在于通过法律工具实现三重平衡: 债权债务的法律平衡:严格依据《民法典…

使用 Isaac Sim 模拟机器人

前言 将 2D 激光雷达数据从 Isaac Sim 流式传输至 ROS 2,并通过 RViz 进行可视化。通过激光雷达数据监控机器人与环境的交互,从而在仿真环境中提升机器人的感知能力。 概览 欢迎来到 入门指南:在 Isaac Sim 中模拟您的第一个机器人 课程。我…

quartz 表达式最近10次执行时间接口编写

Nuget安装 <PackageReference Include"CronExpressionDescriptor" Version"2.41.0" /> <PackageReference Include"CronExpressionDescriptor-zh-CN" Version"2.32.0" /> <PackageReference Include"Quartz"…

解锁数据宝藏:数据挖掘之数据预处理全解析

目录 一、引言&#xff1a;数据预处理 —— 数据挖掘的基石二、数据预处理的重要性2.1 现实数据的问题剖析2.2 数据预处理的关键作用 三、数据预处理的核心方法3.1 数据清洗3.1.1 缺失值处理3.1.2 离群点处理3.1.3 噪声处理 3.2 数据集成3.2.1 实体识别3.2.2 冗余处理3.2.3 数据…

React+Taro创建小程序

第一步&#xff1a;首先确认是否安装Node.js和npm 如果已安装Node.js和npm,以下可以查询 node -v npm -v 第二步&#xff1a;安装Taro CLI npm install -g tarojs/cli 第三步&#xff1a;创建项目 taro init my-react-taro-app 然后可以看到&#xff0c;下图 第四步&…

佳能Canon TS3100 Series打印机信息

打印功能 打印速度&#xff1a;黑白约 7.7 页 / 分钟&#xff0c;彩色约 4 页 / 分钟。打印分辨率&#xff1a;最高可达 48001200dpi&#xff0c;墨滴最小间距为 1/4800 英寸&#xff0c;能够保证高质量的输出&#xff0c;使文字清晰、色彩鲜艳。打印宽度&#xff1a;203.2 毫米…

家用电脑搭建可外网访问的网站服务器操作流程

在互联网时代&#xff0c;拥有一个属于自己的网站是展示个人风采、分享知识经验、开展线上业务的绝佳方式。你是否想过&#xff0c;利用家中闲置的电脑&#xff0c;就能搭建出一个可以被外网访问的网站服务器&#xff1f;这不仅能满足个性化需求&#xff0c;还能节省租用专业服…

CSS知识补充 --- 控制继承

每天学习一点点&#xff01;&#xff01;&#xff01; 总所周知&#xff0c;CSS某些属性可以继承&#xff0c;然后今天看到MDN的时候看到了CSS也可以控制继承&#xff0c;感觉很有意思&#xff0c;所以记录一下&#xff1a; 控制继承有5个属性值&#xff0c;分别&#xff1a;in…

如何使用Ant Design Blazor组件在列表页弹窗增加修改数据

在winform中首次使用net8做页面。列表页想使用Ant Design组件的弹窗组件实现。但第一次在winform项目中使用ant design组件&#xff0c;列表页面&#xff0c;点击新增&#xff0c;或者编辑操作实现弹窗页面&#xff0c;弹窗页面想使用模板页razor页来实现&#xff0c;而不是用m…

嵌入式学习 51单片机01

一、框架 1、CPU&#xff08;Central Processing Unit&#xff0c;中央处理单元&#xff09;‌是计算机的核心部件&#xff0c;负责执行计算机指令和处理数据。 2、MCU&#xff08;Microcontroller Unit&#xff0c;微控制单元&#xff09;‌是一种将中央处理器、内存、输入输出…

C语言之内存对齐

一、为什么要内存对齐 Arm对内存的访问支持字&#xff08;4byte&#xff09;、半字&#xff08;2byte&#xff09;、字节&#xff08;1byte&#xff09;的直接访问&#xff0c;但是呢他们是有一定的要求的&#xff1a; 存取字时要求地址按字对齐&#xff0c;也就是地址要是4的…

Python 基础语法 -----函数

一、函数 1、函数是什么 编程中的函数和数学中的函数有一定的相似之处。 数学上的函数&#xff0c;比如 y sin x&#xff0c;x 取不同的值&#xff0c;y 就会得到不同的结果。 编程中的函数是一段可以被重复使用的代码片段。 &#xff08;1&#xff09;求数列的和&#x…

Windows/Linux系统 Ollama部署deepseek 大模型

Ollama 是一个开源工具&#xff0c;专门用于在本地计算机上运行和操作大型语言模型&#xff08;LLM&#xff09; 官方下载网站&#xff08;https://ollama.ai/&#xff09; Windows系统安装方法 建议命令行安装&#xff08;默认安装会直接安装到C盘&#xff09; OllamaSetu…

用Tensorflow进行线性回归和逻辑回归(一)

这一章告诉你如何用TensorFlow构建简单的机器学习系统。第一部分回顾构建机器学习系统的基础特别是讲函数&#xff0c;连续性&#xff0c;可微性。接着我们介绍损失函数&#xff0c;然后讨论机器学习归根于找到复杂的损失函数最小化的点的能力。我们然后讲梯度下降&#xff0c;…

java/.net跨平台UI浏览器SDK,浏览器控件开发包分析

在 Linux 系统中&#xff0c;虽然没有完全等同于安卓 WebView 的内置浏览器 SDK&#xff0c;但存在多种基于开源浏览器引擎的解决方案&#xff0c;支持通过 Java 代码控制网页加载和执行 JavaScript。以下是具体实现方案和技术细节&#xff1a; 一、核心技术方案对比 方案名称…