在uplift建模中,模型离线指标(QINI、AUUC)提升并不意味着在线A/B实验的收益,因为在线运筹还需要λ\lambdaλ约束。如果模型打分不满足单调增且roi边际递减,那么λ\lambdaλ运筹求解会非常不稳定,导致线上发券偏高,毛利无法兜住。

下面用 两个数值化示例 直观对比:

示例 1:pip_ipi 单调增但不满足边际递减 ⇒ λ\lambdaλ 搜索不稳定

  • 样本数:5

  • 成本:全部 ci=1c_i=1ci=1

  • 预算B=3B=3B=3

  • 打分 pip_ipi(严格单调增,但 Δpi\Delta p_iΔpi = pi−pi−1p_i - p_{i-1}pipi1 不递减/有重复):

i12345
pip_ipi0.100.200.400.400.50
Δpi\Delta p_iΔpi0.100.200.000.10
  • 阈值集 {pi/ci}={0.10,0.20,0.40,0.40,0.50}\{p_i/c_i\}=\{0.10,0.20,0.40,0.40,0.50\}{pi/ci}={0.10,0.20,0.40,0.40,0.50}
  • λ\lambdaλ 越过 0.40 时,会同时将样本 3、4 都剔除,令选中数 C(λ)C(\lambda)C(λ) 从 3 直接跳到 1,形成大阶梯。

C(λ)=#{i:pi>λ}={5,λ<0.10;3,0.10≤λ<0.20;3,0.20≤λ<0.40;1,0.40≤λ<0.50;0,λ≥0.50. C(\lambda)=\#\{i: p_i>\lambda\} \quad=\begin{cases} 5,&\lambda<0.10;\\ 3,&0.10\le\lambda<0.20;\\ 3,&0.20\le\lambda<0.40;\\ 1,&0.40\le\lambda<0.50;\\ 0,&\lambda\ge0.50. \end{cases} C(λ)=#{i:pi>λ}=5,3,3,1,0,λ<0.10;0.10λ<0.20;0.20λ<0.40;0.40λ<0.50;λ0.50.

二分搜索行为

  • [0.20,0.40)[0.20,0.40)[0.20,0.40) 内,任意 mid 都命中 C=3C=3C=3,算法只能不断逼近 0.40,永远无法见到C<3C<3C<3的分支判定,也就卡在边界来回,无法稳定收敛到唯一解。

示例 2:pip_ipi 单调增且满足边际递减 ⇒ λ\lambdaλ 搜索稳定

  • 样本数:5

  • 成本:全部 ci=1c_i=1ci=1

  • 预算B=3B=3B=3

  • 打分 pip_ipi(严格单调增 且 Δpi\Delta p_iΔpi 递减):

iii12345
pip_ipi0.100.180.240.280.30
Δpi\Delta p_iΔpi0.080.060.040.02
  • 阈值集 {0.10,0.18,0.24,0.28,0.30}\{0.10,0.18,0.24,0.28,0.30\}{0.10,0.18,0.24,0.28,0.30},且每次跨过一个阈值,只会剔除一个样本。

C(λ)=#{i:pi>λ}={5,λ<0.10;4,0.10≤λ<0.18;3,0.18≤λ<0.24;2,0.24≤λ<0.28;1,0.28≤λ<0.30;0,λ≥0.30. C(\lambda)=\#\{i: p_i>\lambda\} \quad=\begin{cases} 5,&\lambda<0.10;\\ 4,&0.10\le\lambda<0.18;\\ 3,&0.18\le\lambda<0.24;\\ 2,&0.24\le\lambda<0.28;\\ 1,&0.28\le\lambda<0.30;\\ 0,&\lambda\ge0.30. \end{cases} C(λ)=#{i:pi>λ}=5,4,3,2,1,0,λ<0.10;0.10λ<0.18;0.18λ<0.24;0.24λ<0.28;0.28λ<0.30;λ0.30.

二分搜索行为

  • 目标C(λ)=3C(\lambda)=3C(λ)=3
  • 初始区间 [0.10,0.30][0.10,0.30][0.10,0.30],mid=0.20 → C(0.20)=3C(0.20)=3C(0.20)=3 → 收缩右端 → [0.10,0.20][0.10,0.20][0.10,0.20]
  • mid=0.15 → C=4>3C=4>3C=4>3 → 收缩右端 → [0.10,0.15][0.10,0.15][0.10,0.15]
  • … 依次剔除第2号、第3号样本,每次跨过一个阈值,CCC 变化为 4→3→2…,二分能稳定地一步步逼近恰好使 C=3C=3C=3λ\lambdaλ

核心对比

条件阶梯跳变二分稳定性
示例1:边际不递减或重复值大阶梯(一次掉多个)卡在大跳点来回
示例2:边际严格递减小阶梯(一次掉一个)逐次逼近,稳定收敛
  • 只有当每次 λ\lambdaλ 触碰一个阈值,就只影响一个样本时,累积成本 C(λ)C(\lambda)C(λ) 曲线才近似“单调平滑”,二分才能一步步稳定逼近目标预算。
  • 如果一次跨越多个阈值(示例1),或阈值间距极小/重复(前例),则会出现“跳变过大”或“可行区间过窄”,导致二分收敛失灵或来回摆动。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/94191.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/94191.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/94191.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

音视频学习(四十六):声音的三要素

声音是人类感知世界的重要途径之一。在自然界中&#xff0c;声波本质上是介质中传播的机械振动&#xff0c;而人类对声音的主观感受主要通过三种属性来认知和描述&#xff0c;即音调&#xff08;音高&#xff09;、响度&#xff08;强弱&#xff09;、音色&#xff08;音质&…

spring batch处理数据模板(Reader-Processor-Writer模式)

步骤监听器 Component public class StepListener implements StepExecutionListener {private StepExecution stepExecution;public StepExecution getStepExecution() {return this.stepExecution;}Overridepublic void beforeStep(StepExecution stepExecution) {this.stepE…

【华为OD机试】从小桶里取球

题目描述 某部门开展Family Day开放日活动,其中有个从桶里取球的游戏,游戏规则如下: 有N个容量一样的小桶等距排开,且每个小桶都默认装了数不等的小球, 每个小桶装的小球数量记录在数组bucketBallNums中, 游戏开始时,要求所有桶的小球总数不能超过SUM, 如果小球总…

std::unordered_map 和 std::map的区别【C++】

std::unordered_map 和 std::map 是 C 标准库中两种不同的关联容器&#xff0c;它们都用于存储键值对&#xff0c;但在实现方式、性能特点和使用场景上存在显著区别。以下是它们的主要区别&#xff1a; 1. 数据结构 std::map&#xff1a; 基于 红黑树&#xff08;一种自平衡二叉…

云原生环境里的显示变革:Docker虚拟浏览器与cpolar穿透技术实战

文章目录前言【视频教程】1. 关于neko2. 本地部署neko3. neko简单使用4. 安装内网穿透5. 配置neko公网地址6. 配置固定公网地址前言 现代远程协作本该是无缝衔接的过程&#xff0c;却被这些障碍不断打断&#xff1a;多设备屏幕同步存在延迟、跨平台访问需要复杂配置、公网IP申…

LVGL + ESP-Brookesia 在Windows下的编译和运行

LVGL ESP-Brookesia 在Windows下的编译和运行 1. 项目介绍 本项目是基于 LVGL&#xff08;轻量级多功能图形库&#xff09;和 ESP-Brookesia 的嵌入式模拟桌面应用开发框架&#xff0c;专为嵌入式设备构建丰富的图形界面而设计。通过在Windows环境下模拟嵌入式设备的图形界面…

【ip】IP地址能否直接填写255?

IP地址数值限制​ 最近有朋友后台问我&#xff0c;IP地址里填255行不行&#xff1f;思索着有一阵子没有分享基础的知识&#xff0c;就在今天大致说一下&#xff0c;关于IP地址里填255行不行&#xff1f;答案当然是否定的。 IP地址由4个段组成&#xff0c;每个段的数值范围其实限…

力扣热题100----------141.环形链表

给你一个链表的头节点 head &#xff0c;判断链表中是否有环。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评测系统内部使用整数 pos 来表示链表尾连接到链表中的位置&#xff08;索…

【Java开发日记】我们来说说 LockSupport 的 park 和 unpark

目录 一、LockSupport 1.1、LockSupport函数列表 1.2、基本使用 先 park 再 unpark 先 unpark 再 park 1.3、特点 与 Object 的 wait & notify 相比 二、LockSupport park & unpark原理 2.1、情况一&#xff0c;先调用park&#xff0c;再调用unpark park 操作…

AGI|从“实验室”到“生产线”:企业级AI Agent 如何突围

在数字化转型的深水区&#xff0c;企业级 AI Agent 正从技术概念走向产业实践&#xff0c;成为驱动生产力变革的核心引擎。目录 一、风口已至&#xff1a;AI Agent 的崛起逻辑与市场刚需 二、企业级AI Agent&#xff1a;核心能力与独特价值定位 三、AI Agent 的未来目标 一、…

AtCoder Beginner Contest 417

文章目录A A SubstringB Search and DeleteC Distance IndicatorsD Takahashis ExpectationE A Path in A DictionaryF Random GatheringG Binary CatAtCoder Beginner Contest 417A A Substring You are given an N-character string S consisting of lowercase English lett…

C++23 Concepts:用类型约束重构泛型编程的终极方案

一、开篇:模板元编程的"类型检查困局" 某金融量化团队曾遇到诡异bug: template<typename T> void process(T data) {static_assert(std::is_arithmetic<T>::value, "需要数值类型");// 业务逻辑... } 当调用process("hello")时…

【RK3568 看门狗驱动开发详解】

RK3568 看门狗驱动开发详解一、Linux 看门狗子系统架构​二、设备树配置​三、 看门狗驱动实现四、验证看门狗定时器&#xff08;Watchdog Timer&#xff09;是保障嵌入式系统可靠性的关键硬件&#xff0c;它通过定期接收 “喂狗” 信号监控系统运行状态&#xff0c;当系统故障…

探索 Vue 3.6 新特性:Vapor Mode 与高性能 Web 应用开发

Vue 3.6 简介 Vue.js 是一个广受欢迎的渐进式 JavaScript 框架&#xff0c;以其简洁的 API、灵活的组件系统和高性能著称。Vue 3.6 是 Vue 3 系列的一个重要版本&#xff0c;引入了多项性能优化和新特性&#xff0c;尤其是备受关注的 Vapor Mode&#xff0c;这是一个无需虚拟 D…

初识prometheus

Prometheus&#xff1a;云原生时代的监控利器 在当今快速发展的云原生和微服务架构时代&#xff0c;传统的监控系统面临着巨大的挑战&#xff1a;如何高效地收集海量、动态变化的指标&#xff1f;如何实时告警并快速定位问题&#xff1f;如何实现灵活的可视化和强大的数据查询…

从源码角度分析导致 JVM 内存泄露的 ThreadLocal

文章目录1. 为什么需要ThreadLocal2. ThreadLocal的实现解析1.1 实现分析1.2 具体实现1.3 ThreadLocalMap中Hash冲突的解决1.3.1 Hash冲突解决的几种方法1.3.1.1 开放定值法1.3.1.2 链地址法1.3.1.3再哈希法&#xff1a;1.3.1.4 建立公共溢出区1.3.2 ThreadLocal解决Hash冲突的…

React组件化的封装

1. 组件化封装的结构 1.1. 定义一个类(组件名必须是大写&#xff0c;小写会被认为是html元素), 继续自React.Component1.2. 实现当前组件的render函数 render当中返回的jsx内容&#xff0c;就是之后React会帮助我们渲染的内容 1.3. 结构图如下&#xff1a; data 方法render()…

嵌入式仿真教学的革新力量:深圳航天科技创新研究院引领高效学习新时代

嵌入式系统作为现代信息技术的核心基石&#xff0c;已深度融入工业控制、物联网、智能终端等关键领域。高校肩负着培养嵌入式技术人才的重任&#xff0c;但传统教学方式正面临严峻挑战&#xff1a;硬件实验设备投入巨大、更新滞后、维护繁琐、时空限制严格&#xff0c;难以满足…

六、Linux核心服务与包管理

作者&#xff1a;IvanCodes 日期&#xff1a;2025年8月3日 专栏&#xff1a;Linux教程 要保证一个Linux系统稳定、安全、功能完备&#xff0c;有效管理其后台服务和软件包是至关重要的。本文将深入介绍现代Linux系统中四个核心的管理工具&#xff1a;systemctl (服务管理)&…

【数据结构】哈希表实现

目录 1. 哈希概念 2 哈希冲突和哈希函数 3. 负载因子 4. 将关键字转为整数 5. 哈希函数 5.1直接定址法 5.2 除法散列法/除留余数法 5.3 乘法散列法&#xff08;了解&#xff09; 5.4 全域散列法&#xff08;了解&#xff09; 5.5 其他方法&#xff08;了解&#xff09…