论文地址:https://dl.acm.org/doi/abs/10.1145/3637528.3671581

论文源码:https://github.com/zqiao11/TSCIL

会议:SIGKDD 2024(CCF-A)

现实环境本质上是非平稳的,随着时间推移常会引入新类别。这在时间序列分类中尤为常见,例如医疗领域出现新的疾病分类,或人类活动识别中增加新的活动类型。在此类情况下,要求学习系统有效吸收新类别,同时避免对旧类别的灾难性遗忘,这便催生了类增量学习(CIL)问题。然而,尽管图像和语言领域已取得令人鼓舞的进展,针对时间序列数据的类增量学习研究仍相对不足。现有研究存在实验设计不一致的问题,因此需要在广泛数据集上对方法进行全面评估与基准测试。为此,我们首先概述时间序列类增量学习(TSCIL)问题,强调其独特挑战并涵盖先进方法。此外,基于标准化设置,我们开发了统一的实验框架,该框架支持新算法的快速开发、新数据集的便捷集成以及评估流程的标准化。利用此框架,我们在标准场景和隐私敏感场景下对各种通用及时间序列特定的 CIL 方法进行了全面评估。我们的大量实验不仅为未来研究提供了标准基线,还阐明了批量归一化层或记忆缓冲区容量阈值等各种设计因素的影响。

论文主要提出了一个框架,该框架包含多种增量学习方法,可支持使用者自主选择和添加算法,涵盖基于正则化、经验重放、生成式重放的方法及基线方法。

基于正则化的类增量学习方法

1. LwF(Learning without Forgetting)

  • 特点:通过知识蒸馏(Knowledge Distillation)保留旧知识,在学习新类时最小化新旧任务输出的差异。

2. MAS(Memory Aware Synapses)

  • 特点:通过计算神经元对旧任务的重要性(突触权重),在训练新任务时施加正则化约束,防止关键参数遗忘。

3. DT²W(Deep Task-agnostic Two-stage Weighting)

  • 特点:针对时间序列设计的任务无关权重加权方法,通过两阶段权重调整平衡新旧任务的学习。

基于经验重放的方法

1. ER(Experience Replay)

  • 特点:最基础的经验重放方法,利用记忆缓冲区存储旧任务样本,训练时混合新旧数据以缓解遗忘。

2. DER(Deep Experience Replay)

  • 特点:改进版经验重放,可能通过更高效的样本选择或特征提取增强旧知识保留。

3. Herding

  • 特点:基于聚类的样本选择策略,用代表性样本(而非原始样本)填充记忆缓冲区,减少存储成本。

4. ASER(Asymmetric Experience Replay)

  • 特点:非对称经验重放,可能通过调整新旧样本的权重或采样策略优化增量学习效果。

5. CLOPS(Class-Level Online Plasticity System)

  • 特点:基于类级在线可塑性的系统,可能结合类别级别的样本管理和重放策略。

6. FastICARL

  • 特点:快速增量分类算法,可能通过高效的特征提取和分类器更新机制提升增量学习效率。

基于生成式重放的方法

1. GR(Generative Replay)

  • 特点:利用生成模型(如 TimeVAE)生成旧任务的合成样本,避免存储原始数据,适用于隐私敏感场景。

基线方法

1. Naive

  • 特点:直接微调模型以学习新类,不采取任何抗遗忘策略,作为性能下限。

2. Offline

  • 特点:假设可以访问所有历史数据(非增量场景),作为理想情况下的性能上限参考。

这里我们基于UWave数据集+分类场景详细解释基于经验重放、基于生成式重放和基于正则化的类增量学习方法。

首先我们介绍基于经验重放的增量学习方法,该数据集经过划分任务流,针对每个任务流进行实验,当期模型训练过程中会存储一些样本,同时会提取一些以往的样本作为训练数据。在存储和提取过程中会进行一些算法设计,就形成了不同的基于经验重构的增量学习方法。

其次,基于生成式重放的增量学习方法与基于经验重放的方法类似,就是将缓存区变成生成器。

最后,基于正则化的类增量学习方法通过对上次任务的模型使用本次数据进行校验作为正则化项约束对旧类别的预测。

探究批量归一化(BatchNorm)与层归一化(LayerNorm)对时间序列类增量学习(TSCIL)中模型准确率动态变化的影响,同时对比使用记忆缓冲区(经验重放)的方法与无记忆方法的表现差异。

系统评估基于正则化(Regularization) 和经验重放(Experience Replay, ER) 的类增量学习方法在时间序列数据上的性能,探究不同归一化技术(BatchNorm 与 LayerNorm)对模型抗遗忘能力和增量学习效率的影响。

探究记忆缓存 大小对时间序列类增量学习中经验重放(ER-based)方法的平均准确率的影响,同时对比批量归一化(BatchNorm)与层归一化(LayerNorm)在不同内存限制下的调节作用。

探究不同类型分类器在时间序列类增量学习(TSCIL)中的性能差异,通过消融实验验证交叉熵(CE) 和二元交叉熵(BCE) 训练的单头分类器对模型抗遗忘能力和增量学习效率的影响。

系统验证生成式重放(Generative Replay, GR) 方法在时间序列类增量学习(TSCIL)场景下的有效性,重点评估其在不存储原始数据的隐私敏感条件下,对旧类别知识的保留能力和新类别的学习效率,并通过多数据集对比揭示 GR 在时序数据中的适用边界。

本文介绍了一种用于时间序列类增量学习(TSCIL)的统一评估框架。我们通过全面的对比分析,揭示了现有类增量学习(CIL)策略在解决TSCIL问题时的优势与局限。通过大量实验,我们评估了TSCIL的关键影响因素,包括算法类型、归一化层选择、记忆预算配置以及分类器设计。实验发现,基于重放的方法普遍优于正则化技术,而使用层归一化(LayerNorm)替代批量归一化(BatchNorm)可显著缓解稳定性-可塑性矛盾。我们进一步探讨了时间序列数据特有的关键挑战——这些挑战对TSCIL的成功至关重要。结果与分析突出了归一化处理、数据隐私保护和类内变异等问题的影响机制。我们坚信,本研究为TSCIL领域的研究与发展提供了有价值的参考。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/87180.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/87180.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/87180.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能攻击原理和架构

大家读完觉得有帮助记得关注和点赞!!! 智能攻击系统基于**人工智能(AI)与大语言模型(LLM)技术**,通过**环境感知→自主决策→动态执行→对抗进化**的闭环架构实现高效网络入侵。以下…

Beamer-LaTeX学习(教程批注版)【4】

众所周知,随着显示器普及宽屏化,PPT排版需要多列化来充分利用页面的横向空间。 这节课我们来学习如何创建列,即在beamer中增加列内容,以及如何对齐列。 1 使用不同的宽度来创建列 在beamer中我们通过在页面上使用columns环境来创…

通俗理解JVM细节-面试篇

文章目录 前言JVM概述JVM是什么?解决了什么问题?JVM运行流程JVM 与 JRE,JDK的关系 JVM内存结构JVM区域划分程序计数器栈堆方法区 类加载机制五个阶段加载验证准备解析初始化总结双亲委派模型 垃圾回收内存管理什么是GC?如何判定谁…

意识边疆保卫战:22:47深圳AI-BioFab人机融合危机全息实录

前言 前些天发现了一个巨牛的人工智能免费学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站 🧠《意识边疆保卫战:22:47深圳AI-BioFab人机融合危机全息实录》 副标题:机械义…

langchain从入门到精通(三十四)——RAG优化策略(十)父文档检索器实现拆分和存储平衡

1. 拆分文档与检索的冲突 在 RAG 应用开发中,文档拆分 和 文档检索 通常存在相互冲突的愿望,例如: 我们可能希望拥有小型文档,以便它们的嵌入可以最准确地反映它们的含义,如果太长,嵌入/向量没法记录太多…

Javaweb - 7 xml

XML 是EXtensible Markup Language 的缩写,翻译过来就是可扩展标记语言。即,XML 和 HTML 一样,都是标记语言,也就是说,它们的基本语法都是标签。 特点: 1. 可扩展:即 XML 是允许自定义格式的。但…

qml实现 裁剪进度条

我们需要实现一个垂直进度条效果,但使用图片裁剪的方式。具体需求: 1. 图片位置固定,容器对齐其左边和下边,宽度和图片相同。 2. 容器背景透明,调整裁剪容器的高度,使其有高度进度条的感觉(从下…

Dify 工作流全栈解析:从零构建你的 AI 应用流程引擎

AI工作流的导言: 工作流系统(Workflow System)是 Dify 的核心组成部分,它通过可视化编程界面支持创建复杂的 AI 应用程序。用户可以将不同的功能块连接起来,从而设计出用于处理数据、与 AI 模型交互、管理条件以及执行…

上下位机通讯规则

0:事由 最近开发,上位机Qt与下位机通讯的时候发现通讯规则有些不一样,这里简单记录一下 。所有代码基于元宝生成,属于伪代码不保证真实可用,啊但是逻辑是这么个逻辑。 1:底层通讯规则 以STM32向上位机通讯…

创建平衡二叉树C++

给你一个整数数组 nums &#xff0c;其中元素已经按 升序 排列&#xff0c;请你将其转换为一棵 平衡 二叉搜索树。 平衡二叉树&#xff1a;每个节点的左右子树高度差不超过1 class Solution { public:TreeNode* dfs(vector<int>& nums, int left, int right){if(l…

海光の初体验

背景 八张K100的风扇已经将近一年没转过了…早在今年4月29日&#xff0c;Qwen3正式发布并全部开源8款「混合推理模型」。作为Qwen系列中的最新一代大型语言模型&#xff0c;Qwen3在推理、指令遵循、工具调用、多语言能力等方面进行了全面增强。海光DCU&#xff08;Deep Comput…

场外交易(OTC)财富管理系统开发及解决方案报告

——跨境金融科技赋能机构客户新增长 一、OTC市场现状与机构业务痛点 1. 政策机遇与市场扩容 “北向互换通”期限延长&#xff1a;2025年7月1日&#xff0c;中国外汇交易中心联合香港交易所将利率互换合约期限延长至30年&#xff0c;首日交易规模达15.3亿元&#xff0c;填补超…

pytorch底层原理学习--JIT与torchscript

文章目录 0 目的1 TorchScript1.1 语言特性的限定性1.2 设计目的&#xff1a;模型表达的专注性 2pytorch JIT&#xff08;Just-in-time compilation)2.1pytorch JIT定义2.1pytorch JIT整个过程&#xff1a;1. 前端转换层&#xff1a;生成静态计算图2. 中间表示层&#xff08;IR…

Ubuntu+Nginx+php+SQLite3+typecho手动搭建个人博客

零.Ubuntu环境 一.安装nginx 使用以下指令进行nginx web服务器安装&#xff1a; apt-get install nginx 如果提示找不到安装包&#xff0c;也可以更新一下系统的apt环境包&#xff1a; sudo apt update 安装完成后&#xff0c;可以使用以下指令查看nginx是否处于激活状态&#…

网络协议概念与应用层

1.概念 1.1 例子 点外卖 上述这个过程,就是自定义协议 自定义协议,具体的方式也是非常灵活的 2.几种开发中更常见的格式 2.1xml 上古时期的组织数据的格式 通过标签来组织数据 xml的优势:让数据的可读性变得更好了 劣势:标签写起来繁琐,传输的时候也占用更多网络带宽 2.2…

pytorch学习—7.处理多维特征的输入

2. 线性模型 3.梯度下降算法 4.反向传播(用pytorch算梯度) 5.用pytorch实现线性回归 6.logistic回归 7.处理多维特征的输入_哔哩哔哩_bilibili 7.1代码复现: import numpy as np import torch import matplotlib.pyplot as plt# 1. 获取数据集 xy_data = np.lo

AI助手“智普清言”《三元》(Python)诗解

文本逻辑解清晰&#xff0c;诗意对应技法轻。 笔记模板由python脚本于2025-07-01 06:54:55创建&#xff0c;本篇笔记适合喜欢python三元语句的coder翻阅。 学习的细节是欢悦的历程 博客的核心价值&#xff1a;在于输出思考与经验&#xff0c;而不仅仅是知识的简单复述。 Pytho…

本地RAG实战:用Spring AI+Ollama+DeepSeek+ChromaDB增强文档问答

本文手把手教你在本地部署RAG系统&#xff1a; 用 Spring AI 整合 Ollama&#xff08;运行DeepSeek中文模型&#xff09;ChromaDB 存储本地文档&#xff08;PDF/TXT&#xff09;向量Java程序实现&#xff1a;文档解析 → 语义检索 → 增强生成 最终效果&#xff1a;模型回答更准…

Python 数据分析:DataFrame,生成,用字典创建 DataFrame ,键值对数量不一样怎么办?

目录 1 示例代码2 欢迎纠错3 论文写作/Python 学习智能体------以下关于 Markdown 编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右S…

Java 并发编程的 CAS(Compare and Swap)是什么?

CAS&#xff08;Compare and Swap&#xff0c;比较并交换&#xff09; 并非 Java 语言特有的概念&#xff0c;而是现代计算机硬件提供的一条核心原子指令。在 Java 并发编程中&#xff0c;它扮演着“幕后英雄”的角色&#xff0c;是构建高性能、无锁并发工具&#xff08;如原子…