2025深度学习发论文&模型涨点之——机器学习+组合优化

机器学习(ML)与组合优化(CO)的交叉研究已成为运筹学与人工智能领域的前沿方向。传统组合优化方法(如分支定界、动态规划)虽在理论上有严格的性能保证,但在处理高维、不确定性问题时往往面临计算复杂度爆炸的挑战。与此同时,机器学习技术(特别是深度强化学习与图神经网络)展现出强大的特征提取与策略泛化能力,为突破传统方法的局限性提供了新范式。

我整理了一些机器学习+组合优化【论文+代码】合集,需要的同学公人人人号【AI创新工场】发525自取。

论文精选

论文1:

[NIPS] DeepACO: Neural-enhanced Ant Systems for Combinatorial Optimization

DeepACO:用于组合优化的神经增强蚁群系统

方法

      深度强化学习与蚁群优化结合:提出了一种通用框架DeepACO,利用深度强化学习自动化启发式设计,增强传统蚁群优化(ACO)算法。

      神经网络作为启发式函数:使用图神经网络(GNN)作为启发式学习器,将问题实例映射到启发式度量,指导蚁群优化的解构建过程。

      局部搜索与神经引导扰动结合:提出了一种新的局部搜索方法,通过神经引导的扰动帮助蚁群优化逃离局部最优解。

      单一神经模型与超参数集:DeepACO使用单一神经模型和单一超参数集,在多个组合优化问题(COPs)上表现出色,无需针对每个问题定制。

      图片

        创新点

        性能提升:DeepACO在八个不同的组合优化问题上,使用单一神经模型和超参数集,一致优于其ACO对应算法。例如,在旅行商问题(TSP)上,DeepACO相比于传统ACO算法,平均目标值降低了约10%。

        通用性增强:DeepACO能够广泛应用于多种COPs,包括路径规划、分配、调度和子集问题,无需针对每个问题进行专家设计。

        探索与利用平衡:提出了三种扩展实现,包括多头解码器、带额外熵损失的训练和带额外模仿损失的训练,以更好地平衡探索和利用,进一步提升了性能。

        灵活性与可扩展性:DeepACO可以轻松扩展到不同的蚁群优化变体和不同的信息素模型,例如从基于连续选择的信息素模型扩展到基于物品价值的信息素模型。

        图片

        论文2:

        [NIPS] Optimizing Solution-Samplers for Combinatorial Problems: The Landscape of Policy-Gradient Methods

        优化组合问题的解采样器:策略梯度方法的景观

        方法

        策略梯度方法:使用深度神经网络作为解生成器,通过策略梯度方法进行训练,以逐步获得更好的解分布。

        熵正则化:引入熵正则化来优化目标函数,使优化过程更加平稳,避免梯度消失问题。

        快速/慢速混合生成器:提出一种快速/慢速混合生成器,通过结合快速收敛和保持非平凡方差的组件,解决梯度消失问题。

        理论框架:建立了一个理论框架,分析了策略梯度方法在组合优化中的有效性,包括解生成器的表达能力、参数数量和优化景观。

        图片

        创新点

          性能提升:通过熵正则化和快速/慢速混合生成器,显著提高了策略梯度方法在组合优化问题上的性能。例如,在Max-Cut问题的小规模实例(15个节点)上,使用正则化目标的模型能够100%找到最优解,而未正则化的模型仅能找到约65%的最优解。

          理论保证:提供了理论证据,证明了在广泛的组合优化问题类别中,存在具有多项式参数数量且优化景观良好的解生成器。

          优化景观改善:通过熵正则化和混合生成器,设计了一个“准凸”的优化目标,使得梯度下降能够有效地收敛到全局最优解。

          普适性:该方法适用于多种组合优化问题,包括Max-Cut、Min-Cut、Max-k-CSP、最大权重二分图匹配和旅行商问题。

          图片

          论文3:

          The Machine Learning for Combinatorial Optimization Competition (ML4CO): Results and Insights

          机器学习用于组合优化竞赛(ML4CO):结果与见解

          方法

            机器学习增强求解器:通过机器学习模型替换传统组合优化求解器中的关键启发式组件,以提高求解器性能。

            三个挑战任务:竞赛包含三个任务:寻找最佳可行解(原始任务)、生成最紧的最优性证明(对偶任务)和选择合适的求解器配置(配置任务)。

            数据驱动的算法设计:利用历史数据训练机器学习模型,以适应特定问题分布,提高求解效率和解的质量。

            统一API接口:通过基于Python的Ecole库提供的类似OpenAI Gym的API,使参与者能够与求解器进行交互。

            图片

            创新点

            性能提升:在多个基准测试中,使用机器学习增强的求解器相比于传统求解器,在寻找最佳可行解、生成最优性证明和配置求解器参数方面表现出显著提升。例如,在平衡物品放置问题上,获胜的机器学习方法相比于基线方法,将原始积分指标降低了约40%。

            数据驱动的优化:通过从历史数据中学习模式和规律,机器学习模型能够自动调整求解器的行为,以适应特定问题的结构,减少了手动调优的工作量。

            多任务优化:竞赛涵盖了从寻找可行解到证明最优性以及配置求解器的多个方面,展示了机器学习在组合优化中的多功能性和潜力。

            实践相关性:竞赛所使用的数据集来源于实际应用,如大规模能源分配网络、工作负载分配和海运库存路由,验证了机器学习方法在现实世界问题中的适用性。

            图片

            本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
            如若转载,请注明出处:http://www.pswp.cn/news/903678.shtml
            繁体地址,请注明出处:http://hk.pswp.cn/news/903678.shtml
            英文地址,请注明出处:http://en.pswp.cn/news/903678.shtml

            如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

            相关文章

            服务器硬件老化导致性能下降的排查与优化

            随着企业数字化转型的深入,服务器作为IT基础设施的核心载体,其稳定性与性能直接影响业务连续性。然而,硬件老化导致的性能衰减问题普遍存在且易被忽视。本报告通过系统性分析服务器硬件老化现象,提出多维度排查方法与优化方案&…

            删除k8s某命名空间,一直卡住了怎么办?

            以 kubectl delete ns cert-manager 命令卡住为例,并且命名空间一直处于 Terminating 状态,说明 Kubernetes 无法完成删除操作,通常是因为 Finalizers 阻塞或某些资源无法正常清理。 解决方法 1. 检查命名空间状态 kubectl get ns cert-man…

            【分享】变声器大师[特殊字符]乔碧萝同款变声[特殊字符]游戏变声[特殊字符]

            多种变声器效果可选:爷爷、大叔、小孩、机器人...... 使用变声器时只需轻轻一点,让你成为潮人 【应用名称】:变声器大师 【应用版本】:6.1.35 【应用大小】:116M 【测试机型】:小米14 【下载链接】:https:…

            【Part 2安卓原生360°VR播放器开发实战】第二节|基于等距圆柱投影方式实现全景视频渲染

            《VR 360全景视频开发》专栏 将带你深入探索从全景视频制作到Unity眼镜端应用开发的全流程技术。专栏内容涵盖安卓原生VR播放器开发、Unity VR视频渲染与手势交互、360全景视频制作与优化,以及高分辨率视频性能优化等实战技巧。 📝 希望通过这个专栏&am…

            【JavaScript】相等运算符、条件运算符

            1、相等运算符 &#xff08;1&#xff09;&#xff08;相等&#xff09; 相等运算符用来比较两个值是否相等&#xff0c;如果相等会返回true&#xff0c;否则返回false <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"…

            OceanBase数据库-学习笔记5-用户

            用户相关命令 命令描述CREATE USER ‘username’‘host’ IDENTIFIED BY ‘password’;创建用户。GRANT ALL PRIVILEGES ON database_name.* TO ‘test_user’‘%’;给用户授权所有权限。GRANT SELECT, INSERT, UPDATE ON database_name.* TO ‘test_user’‘%’;给用户授权指…

            K8S Secret 快速开始

            一、什么是 Secret&#xff1f; Kubernetes&#xff08;K8s&#xff09;中的 Secret 是一种用于存储和管理敏感信息&#xff08;如密码、令牌、证书、API 密钥等&#xff09;的资源对象。它避免了将敏感数据明文写入配置文件、镜像或代码中&#xff0c;提供了一种更安全的方式…

            【分享】音频音乐剪辑[特殊字符]人声分离伴奏提取[特殊字符]拼接合并

            音频音乐剪辑是一款专业的剪辑软件。在剪辑过程中&#xff0c;它可以对音频进行拼接合成、音乐裁剪、变调变速、格式转换&#xff0c;同时音频音乐剪辑还是一款支持高清录音、音频降噪等众多功能于一体的音频制作软件。 【应用名称】&#xff1a;音频剪辑 【应用版本】&#xf…

            力扣-数据结构-二叉树

            94. 二叉树的中序遍历 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 示例 1&#xff1a; 输入&#xff1a;root [1,null,2,3] 输出&#xff1a;[1,3,2]示例 2&#xff1a; 输入&#xff1a;root [] 输出&#xff1a;[]示例 3&#xff1a; 输入&#x…

            oracle怎样通过固化较优执行计划来优化慢sql

            一 问题描述 有次生产环境cpu使用率增高&#xff0c;ADDM报告提示某条sql比较耗费cpu&#xff1a; 提示&#xff1a; 在分析期间, 此 SQL 语句至少利用了 6 个不同的执行计划 #查看该sql都有哪些执行计划 SELECT * FROM table(DBMS_XPLAN.DISPLAY_AWR(sqlid值)); 我手动执…

            基于c#,asp.net webform, sql server数据库,在线档案管理系统

            详细视频: 【基于c#,asp.net webform, sql server数据库&#xff0c;在线档案管理系统包部署。-哔哩哔哩】 https://b23.tv/c1RsdRO

            WebRTC SDK是什么?

            ​语音环境每年都在变&#xff0c;OKCC以前代理商的客群都是简单高效外呼为主&#xff0c;今年发现变化很大。很多代理商做的终端客户都是给其他业务系统赋能为主了。主流的还是以API对接为主&#xff0c;但是对接中发现webrtc SDK使用频率很高。 ​ ​那么什么是WebRTC SDK…

            Vue3源码学习3-结合vitetest来实现mini-vue

            文章目录 前言✅ 当前已实现模块汇总&#xff08;mini-vue&#xff09;✅ 每个模块简要源码摘要1. reactive.ts2. effect.ts3. computed.ts4. ref.ts5. toRef.ts6. toRefs.ts ✅ 下一阶段推荐目标所有核心模块对应的 __tests__ 测试文件&#xff0c;**带完整注释**✅ reactive.…

            PH热榜 | 2025-04-30

            1. Daytona 标语&#xff1a;安全且灵活的基础设施&#xff0c;用于运行你的人工智能生成的代码。 介绍&#xff1a;Daytona Cloud 为 AI 智能体重塑了基础设施&#xff0c;具备不到 90 毫秒的启动时间、原生性能以及有状态执行的能力&#xff0c;这些是传统云计算所无法实现…

            Android compileSdkVersion、minSdkVersion、targetSdkVersion的关系以及和Unity的关系

            compileSdkVersion、minSdkVersion、targetSdkVersion的关系 参考&#xff1a;https://mp.weixin.qq.com/s?__bizMzg5MzYxNTI5Mg&mid2247494238&idx1&sn06285667d3ac1339f6d2daae840cedc8&chksmc125565280f1ad3aa127774c2d1e59eb2818f89f0cb3ed4d72145faf619…

            数据库的死锁相关(一)

            目录 前言 一、什么死锁 二、产生死锁的必要条件 三、死锁发生的具体位置和场景 1. 数据行级别死锁&#xff08;最常见&#xff09; 2. 表级别死锁 3. 索引间隙锁死锁&#xff08;InnoDB特有&#xff09; 4. 外键约束死锁 5. 元数据锁死锁 6. 内存中的锁结构死锁 7.…

            Three.js + React 实战系列-3D 个人主页:构建 Hero 场景组件(项目核心)✨

            在本节中&#xff0c;我们将完成整个 3D 主业项目中最核心的组件 —— Hero.jsx。 这个组件作为首页的主视觉部分&#xff0c;整合了 3D 模型、动画相机、交互按钮与自适应布局&#xff0c;构建出一个立体、酷炫、可交互的主场景。 前置准备&#xff1a; ✅安装依赖&#xff…

            Electron Forge【实战】桌面应用 —— 将项目配置保存到本地

            最终效果 定义默认配置 src/initData.ts export const DEFAULT_CONFIG: AppConfig {language: "zh",fontSize: 14,providerConfigs: {}, };src/types.ts export interface AppConfig {language: zh | enfontSize: numberproviderConfigs: Record<string, Recor…

            RPG4.设置角色输入

            这一篇是进行玩家移动和视角移动的介绍。 1.在玩家内进行移动覆写 virtual void SetupPlayerInputComponent(UInputComponent* PlayerInputComponent) override; 2.创建增强输入资产的变量创建 UPROPERTY(EditDefaultsOnly, BlueprintReadOnly, Category "CharacterD…

            [实战] Petalinux驱动开发以及代码框架解读

            目录 Petalinux驱动开发以及代码框架解读一、引言二、步骤2.1 创建PetaLinux工程2.2 配置硬件描述文件2.3 设备树配置2.4 建立驱动框架2.5 编辑 .bb 文件2.6 编写驱动文件2.7 编写 Makefile2.8 验证配方配置2.9 集成驱动到 RootFS2.10 全系统编译与部署2.11 启动验证 三、框架解…