在如今机器学习的浪潮中,机器学习相关的岗位日益增多,而运筹优化的岗位却相对较少。这是今年我秋招过程中看到的现象。企业越来越希望候选人不仅能建模求解,还能理解如何用数据驱动优化。需要我们有一个完整的技术栈。那么我们就来看看OR与ML的关系,探索一下两者结合的方向,以便认清后续发展道路。

首先,ML和OR并非替代关系,而是互补协同的两种决策科学工具。

  1. ML擅长预测:从历史数据中学习模式;OR擅长决策:在资源约束下寻找最优解或可行解。

  2. 1.ML for OR

  3. 1.1 ML不直接做决策,而是提升OR模型的输入质量。

  4. 这里有一个很重要的概念Predict-then-Optimize,指的是先用ML模型预测不确定性参数,再讲预测值带入优化模型求解。

  5. 这其中会有一些潜在的风险,首先就是目标错配,这是指ML模型通常以MAE/MSE为目标训练,但这些误差对决策的影响可能不对称。比如:高估了需求导致库存积压、低估了需求导致缺货,这两者代价在实际应用总是不同的,但是如果我们使用MAE/MSE为目标进行训练,将会把两者一视同仁。也就是说,我们想直接将决策风险(也就是上面说的高估了多少还是低估了多少)作为损失函数。但是,通过Predict-then-Optimize的流程:

  6. 输入数据 → ML 模型 → 预测值 → 优化模型 → 决策 → 实际成本

    会发现这当中的优化模型,也就是我们通常可能调用求解器求解的数学模型(这就是OR的部分),是一个“黑箱算子”,通常不可导,那么对于我们的ML来说就没法进行它的核心算法——反向传播

  7. 为了解决这个问题,有学者提出了SPO(Smart Predict-then-Optimize),这是一个框架,他的核心思想就是训练的损失应该与最终决策的代价挂钩。将决策风险定义为:使用预测值求解后的成本与使用真实值求解的成本之差。训练目标是最小化这个决策风险。可以通过次梯度平滑近似等方式来近似梯度。

  8. 此外还可以使用可导的近似模型、不依赖中间梯度的强化学习等方式来解决这个问题。

  9. 上面说的不可导性与黑箱性也是潜在风险之一。

  10. 还有就是误差放大的潜在风险。对于解空间敏感的OR问题,小的预测误差可能导致完全不同的最优解。需要引入敏感性分析,评估预测误差对解的影响。

  11. 1.2 OR求解器集成ML技术,加速求解过程。

  12. 学习策略分支:使用ML模型预测哪个变量分支最有希望,替代部分强分支调用;

  13. 节点选择策略:学习哪种策略(深度优先、最佳有限、最佳估计)更适合当前问题结构;

  14. 启发式参数自动调优;割平面选择等等。

  15. 2.OR for ML

  16. 用运筹优化(OR)来提升机器学习(ML)性能。

  17. 最优实验设计:建模为子集选择问题;

  18. 神经网络剪枝与结构搜索:保留哪些连接可以建模为0-1变量,使用OR压缩模型;

  19. 强化学习中嵌入求解器;可解释机器学习中的规则生成等等。

  20. 3.End-to-End Learning for Optimization

  21. 跳过显式建模,直接用神经网络学习从输入到最优解的映射。在这个过程中,输出可能违反问题的约束,因此需要结合OR使用。我认为当前最好的做法是:用端到端ML模型生成候选解,再用 OR 模型校正或排序。

  22. 4.未来方向

  23. 我们做运筹优化的最担心的就是未来ML取代传统的OR。但是从目前来看是不会的,两者将会进行深度融合,会有ML for OR,也会有OR for ML。首先,OR的优势是不可替代的,给出能够满足硬约束的最优解、解释性强等等。其次,ML是由局限性的,无法保证约束满足、解释性差(黑箱性)、泛化能力依赖于数据分布等等。

  24. 结合我做的来说一下吧,在一些控制策略(红绿灯)中我会用OR的数学规划和元启发式算法得到这个问题的baseline,然后在环境突然发生改变(救护车来到)时,使用RL实现动态调整。在智能驾驶的场景中,自动驾驶需要感知和规划的协同,对环境的感知需要ML,对路径和时间的精确规划需要OR。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/920135.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/920135.shtml
英文地址,请注明出处:http://en.pswp.cn/news/920135.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法

GitHub Copilot 在 VS Code 上的终极中文指南:从安装到高阶玩法 前言 GitHub Copilot 作为 AI 编程助手,正在彻底改变开发者的编码体验。本文将针对中文开发者,深度解析如何在 VS Code 中高效使用 Copilot,涵盖基础设置、中文优化…

安全测试、web探测、httpx

💢 简介 httpx 是一个快速且多用途的HTTP工具包,允许使用retryablehttp库运行多个探测器。它旨在通过增加线程数量来保持结果的可靠性。 功能 🤪 发送 GET、POST、PUT、DELETE 等 HTTP 请求支持流式传输支持重定向支持身份验证支持代理支持 …

CNN 中 3×3 卷积核等设计背后的底层逻辑

为什么卷积核爱用 33?CNN 设计 “约定俗成” 的底层逻辑 做深度学习的同学,对 CNN 里 33 卷积核、最大池化、BN 层这些设计肯定不陌生,但你有没有想过:为啥卷积核总选 33?池化层为啥默认最大池化?BN 层又是…

税务岗位职场能力解析与提升路径规划

税务岗位作为企业运营的核心环节之一,对从业者的专业能力与综合素质要求极高。从基础税务核算到战略税务筹划,职场能力的提升需要系统化的路径规划。以下从核心能力、阶段化提升路径及证书价值三个维度展开分析。核心能力体系构建专业税务能力是基础&…

MySQL 索引:结构、对比与操作实践指南

MySQL系列 文章目录MySQL系列前言案例一、认识MySQL与磁盘1.1 MySQL与存储1.2 MySQL 与磁盘交互基本单位二、 MySQL 数据交互核心:BufferPool 与 IO 优化机制三、索引的理解3.1 测试案例3.2 page3.3 页目录3.3 对比其他结构四、聚簇索引 VS 非聚簇索引五、索引操作5…

GitHub 热榜项目 - 日榜(2025-08-24)

GitHub 热榜项目 - 日榜(2025-08-24) 生成于:2025-08-24 统计摘要 共发现热门项目:20 个 榜单类型:日榜 本期热点趋势总结 本期GitHub热榜呈现三大技术热点:1)AI应用爆发式创新,包括神经拟真伴侣&#…

纯净Win11游戏系统|24H2专业工作站版,预装运行库,无捆绑,开机快,游戏兼容性超强!

哈喽,大家好! 今天给大家带来一款 Windows 11 游戏版本系统镜像,软件已放在文章末尾,记得获取。 一、软件获取与启动 解压后双击exe即可直接运行,无需额外安装。首次启动界面简洁,引导清晰。 二、系统选…

CI/CD 学习之路

目录 简介: 1、工具介绍: 2、搭建jenkins 1)创建一个文件Dockerfile,文件无后缀,写入以下代码 2)在Dockerfile文件所在目录执行(my-jenkins-android 未自定义镜像名称) 3&#xf…

马斯克宣布开源Grok 2.5:非商业许可引争议,模型需8×40GB GPU运行,Grok 3半年后开源

昨晚,马斯克在 X 平台连续发布多条消息,宣布其人工智能公司 xAI 已正式开源 Grok 2.5 模型。这款模型是 xAI 在 2024 年的主力模型,如今完全向公众开放。与此同时,马斯克还预告了下一代模型 Grok 3 的开源计划,预计将在…

DMP-Net:面向脑组织术中成像的深度语义先验压缩光谱重建方法|文献速递-深度学习人工智能医疗图像

Title题目DMP-Net: Deep semantic prior compressed spectral reconstruction methodtowards intraoperative imaging of brain tissueDMP-Net:面向脑组织术中成像的深度语义先验压缩光谱重建方法01文献速递介绍脑肿瘤可分为原发性和继发性两类。原发性脑肿瘤多发生…

【nl2sql综述】2025最新综述解读

论文地址:https://arxiv.org/pdf/2408.05109 解读:迈向数据民主化——大型语言模型时代下的Text-to-SQL技术综述 近期,一篇名为《A Survey of Text-to-SQL in the Era of LLMs》的综述论文系统性地梳理了自然语言到SQL查询(Text-t…

logback-spring.xml 文件

一.概述这是一个日志文件,主要用来对应用程序的日志进行记录,并且可以配置日志的一些格式和规则。二.读取机制1.SpingBoot自动识别进行文件扫描时,当在 classpath 下发现名为 logback-spring.xml 的文件时,Spring Boot 会自动加载…

LeetCode Hot 100 第二天

1. 283 移动零 链接&#xff1a;题目链接 题解&#xff1a; 要求&#xff1a;时间复杂度 < O (n^2) 题解&#xff1a;将非零元素依次往前移&#xff08;占据0元素的位置&#xff09;&#xff0c;最后再将0元素填充至数组尾。时间复杂度O(n)&#xff0c;用一个指针x来维护非…

04-Maven工具介绍

文章目录1、Maven官网2、Maven的3个重要功能3、Maven安装3.1 安装教程的视频3.2 安装教程的文本1、Maven官网 https://maven.apache.org/ 2、Maven的3个重要功能 黑马程序员JavaWeb基础教程&#xff0c;Java web从入门到企业实战完整版 3、Maven安装 3.1 安装教程的视频 …

基于开源 AI 智能名片链动 2+1 模式 S2B2C 商城小程序的新开非连锁品牌店开业引流策略研究

摘要&#xff1a;本文聚焦于一家新开且地理位置优越、目标客户为周边“80 后”“90 后”上班族的非连锁品牌店。在明确店铺定位、完成店内设计与菜品规划等基础工作后&#xff0c;探讨如何在新店开业初期有效打响品牌、吸引目标客户。通过引入开源 AI 智能名片链动 21 模式 S2B…

UE5多人MOBA+GAS 54、用户登录和会话创建请求

文章目录创建主菜单需要的创建主菜单游戏模式创建主菜单游戏控制器创建主菜单界面UI实现登录游戏实例创建等待界面配置和获取协调器 URL撰写和发送会话创建请求创建主菜单需要的 创建主菜单游戏模式 MainMenuGameMode 创建主菜单游戏控制器 MainMenuPlayerController #p…

SCSS上传图片占位区域样式

_App.scss// 上传图片占位区域样式---------------------------------------- [theme"uploadImage"] {transition: 0.2s;position: relative;cursor: pointer;border-radius: 4px;/*居中填满*/background-repeat: no-repeat;background-position: center;background-…

Prometheus+Grafana监控mysql

1、简述 使用 Prometheus 结合 Grafana 监控 MySQL 是一套成熟且广泛应用的方案&#xff0c;能实现对 MySQL 性能、状态等指标的实时采集、存储、可视化及告警。 2、整体架构说明 Prometheus&#xff1a;负责定时从 MySQL 采集监控指标&#xff08;需借助 Exporter&#xff0…

网络流量分析——Tcpdump 数据包过滤

文章目录.PCAP 文件Tcpdump 数据包过滤过滤和高级语法选项有用的 TCPDump 过滤器主机过滤器源/目标过滤器使用源和端口作为过滤器将目标与网络过滤器结合使用协议过滤器 - 通用名称协议过滤器 - 编号端口过滤器端口范围过滤器小于/大于过滤器利用更大的AND 过滤器无滤镜的基本捕…

DeepSeek V3.1 横空出世:重新定义大语言模型的边界与可能

当大语言模型领域的竞争进入白热化阶段&#xff0c;一场静默的技术革命正在悄然酝酿。2025 年8月19日&#xff0c;DeepSeek 团队带着全新升级的 V3.1 版本强势登场&#xff0c;这个被业内称为 “智能体时代敲门砖” 的模型&#xff0c;究竟藏着多少颠覆认知的黑科技&#xff1f…