https://www.lamda.nju.edu.cn/chengq/optfall24/slides/Lecture_9.pdf

目录

关于对偶的一些解释

1. Max-min characterization 最大最小准则

2. Saddle-point Interpretation 鞍点解释

3. Game interpretation 博弈论里的对偶

Optimality Conditions 最优条件

1. Certificate of Suboptimality and Stopping Criteria 次优性证明与停止准则

2. Complementary Slackness 互补松弛性

3. KKT Optimality Conditions

Ex.1

Ex.2

4. Solving the Primal Problem via the Dual 通过对偶解原问题

例1. Entropy Maximization 最大熵问题

例2. 等式约束与函数分配

5. Examples

5.1 引入新变量及相关等式约束

5.1.1 Unconstrained geometric program

5.1.2  Norm approximation problem

5.1.3不等式约束的几何规划

5.2 原目标函数的转换

5.3显式约束隐式化 纳入目标函数的定义域

6. Generalized inequalities 广义不等式

Ex.1

Ex.2


关于对偶的一些解释

1. Max-min characterization 最大最小准则

如果有f>0 选取无穷大λ 上界就达到无穷; 如果所有 f≤0 取λ=0 结果即为f0

原问题  对偶问题

代入这两个 p*为上界的下界 以及 d*为下界的上界 可重写强弱对偶

2. Saddle-point Interpretation 鞍点解释

3. Game interpretation 博弈论里的对偶

玩家1选择w  玩家2 选择z  玩家1向玩家2支付 因此1想最小化   2想最大化

若玩家1先选 会预判到 玩家2会选择他选后的最优 即为上界

所以玩家1会选 交易为

若玩家2先手 则交易为

这个问题中 同一玩家 先动时一定比后动时收益更高,最优对偶的间隙gap即为先动优势。

但如果鞍点存在,先后动的最优一致,均为鞍点处。

回到之前的拉格朗日问题 即为玩家1选x 玩家2选λ,最优的x*对应p* 最优的λ*对应d*。

Optimality Conditions 最优条件

1. Certificate of Suboptimality and Stopping Criteria 次优性证明与停止准则

如果能找到一个原问题的可行解f0(x) 对偶问题的可行解g(λ,v)   可框定范围 g(λ,v) ≤ d *≤ p* ≤ f0(x)

可在迭代k次后 计算一下对偶间距 绝对误差 相对误差,帮助确定迭代的终止条件

2. Complementary Slackness 互补松弛性

强对偶成立时 原问题对偶问题最优值相等 下面两个≤ 都得取等

需要 由于每一项≤0  也就需要每个都=0 

也就有互补松弛性 其中一个>0 则有另一个=0

     

3. KKT Optimality Conditions

KKT条件是 非凸优化的必要条件(可推出)    特别地,是凸优化的充要条件

对于对偶间距为0的强对偶问题 若最优点为 

 偏导数为0

可行条件     对偶条件

总偏导数为0

为什么对于凸优化充分:

对于凸优化而言,f是凸函数 h是仿射函数 偏导为0就可推出 L是全局最小值

对于一般优化 KKT(偏导为0)是MIN 的必要条件 ; 凸优化 KKT <=> MIN

Ex.1

是凸优化 因为没有不等式约束 KKT只有等式约束和偏导=0 两个条件

Ex.2

列出KKT条件 三个原先 一个对偶 一个总偏导

  用其他量表示λ 消去λ

     

因为x*求和为1 就像把1体积的水倒入 底部高度为αi的容器 水位在1/v*

如果不用凸优化 偏导为 越小降低空间越大

每次调高偏导最小的x 最后结果即确定一个阈值(水位)阈值以下的加到阈值

4. Solving the Primal Problem via the Dual 通过对偶解原问题

若对偶最优解(λ*,v*)存在,对应到 min L(x,λ*,v*)       λ v先确定的前提下 x对应使L最小的取值

原问题可行,则对偶问题有最优解; 原问题无可行解,则对偶问题无界

四步:1.写出对偶问题  2.slater条件 是否强对偶  3.求解对偶问题  4.KKT 对偶问题对应原问题

例1. Entropy Maximization 最大熵问题

 NJU 凸优化导论(8) Lagrange Dual 拉格朗日对偶-CSDN博客

之前在共轭函数 slater条件那里 两次提过这个例子(附近的知识点遗忘可以点上面链接复习一下)

满足弱版本的slater条件 不等式为仿射函数

求解对偶问题:对偶问题对v求导 再代入对偶问题

 

求解λ和v之后带入得x   

例2. 等式约束与函数分配

求解对偶函数得到v*

若f都是凸函数 则L也是凸函数 则目标x要最小化L  L对x求偏导 得x*与v*的关系

5. 变形重构原问题 转换对偶

通过示例说明,对一个问题进行简单的等价重构,可能会得到截然不同的对偶问题

5.1 引入新变量及相关等式约束

  没约束 写拉格朗日还是本身

由原来的无约束 添加变量写成有等式约束

    拉格朗日形式为

 否则下界就负无穷

所以总的对偶问题可以写成 

5.1.1 Unconstrained geometric program

 原问题添加变量写成

对共轭形式求偏导 且要满足条件  

用v消去y得到共轭函数   把共轭函数和条件对应定义域  得到对偶问题

5.1.2  Norm approximation problem

 把仿射拿出来 改写成

 代入范数的共轭得

仿射套函数 可改写为 否则x就可以使L到无穷小   每个f都写成共轭

故可以写作

5.1.3不等式约束的几何规划

我们   就变成 可代入上模版

利用这个 指数求和对数 exp-sum-log 的共轭

5.2 原目标函数的转换

把原问题的f0 用一个递增函数替换 使得结果不变 但使得对偶问题更好

一个方式的范数变换 是之前上面的 5.1.2 Norm approximation problem  但我们还可以

 把二范数平方/2 使得更好求导

 对y偏导得 

最后的对偶问题为

5.3显式约束隐式化 纳入目标函数的定义域

 

如果改写 把盒形约束放到 f0 中

       

v前的系数为 Av+c 因为要最小化 对于每个x 如果系数为正就取l 为负就取u

好处是 这个对偶最后是一个无约束问题

6. Generalized inequalities 广义不等式

      

广义的Slater条件 换成广义小于

Ex.1

Ex.2

Slater条件 

     消掉λ 再代入

同样具有互补松弛性

同样的 Slater条件、KKT条件、互补松弛性 只是把不等式改成广义不等式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/89594.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/89594.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/89594.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue Swiper组件

Vue 渐进式JavaScript 框架 基于Vue2的学习笔记 - Vue Swiper组件实现笔记 目录 Swiper组件 下载swiper 创建swiper组件 保存时修复 编写swiper内容 引入swiper 使用swiper Swiper子组件 创建Swiper列表组件 使用子组件 增加生命周期 增加图片显示 加载数据 渲染…

Linux:lvs集群技术

一.集群和分布式1.1 集群集群是为了解决某个特定问题将多台计算机组合起来形成的单个系统。即当单独一台主机无法承载现有的用户请求量&#xff1b;或者一台主机因为单一故障导致业务中断的时候&#xff0c;就可以增加服务主机数&#xff0c;这些主机在一起提供服务&#xff0c…

【管理】持续交付2.0:业务引领的DevOps-精要增订本,读书笔记(理论模型,技术架构,业务价值)

【管理】持续交付2.0&#xff1a;业务引领的DevOps-精要增订本&#xff0c;读书笔记&#xff08;理论模型&#xff0c;技术架构&#xff0c;业务价值&#xff09; 文章目录1、持续交付的理论模型&#xff08;第1-3章&#xff09;1.1 结构图1.2 持续交付的演进1.3 双环模型理论体…

Wilcox检验的星星怎么规定的?

在 R 里&#xff0c;常见的把 p 值映射为“星号”标记&#xff08;显著性水平&#xff09;的规则通常是&#xff1a;p 值范围标记p ≤ 0.0001“****”0.0001 < p ≤ 0.001“***”0.001 < p ≤ 0.01“**”0.01 < p ≤ 0.05“*”0.05 < p ≤ 0.1“.”p > 0.1…

https与DNS的运行流程

HTTPS流程&#xff1a;HTTPS核心:加了TLS层&#xff0c;加密传输身份认证TLS:信息加密、校验机制、身份证书TLS&#xff08;Transport Layer Security&#xff09;握手是建立安全通信通道的关键过程&#xff0c;发生在客户端&#xff08;如浏览器&#xff09;和服务器之间。其主…

板子 5.29--7.19

板子 5.29–7.19 目录 1. 树状数组 2. KMP 3. 矩阵快速幂 4. 数位DP 5. 状压枚举子集 6. 快速幂&#xff08;新版 7. priority_queue 8. dijkstra 9. 单调栈 10. debug内容 1. 树状数组 // 树状数组 快速求前缀和 / 前缀最大值 // 维护位置数量(离散化)...// (区间加 区间求和…

min-max容斥学习笔记

最近报了航电的春季赛&#xff0c;在一道题目里面遇到了做法&#xff0c;感觉挺有意思。 考虑一个&#xff08;多重&#xff09;集合S{ai}S\{a_i\}S{ai​}&#xff0c;有如下的等式成立 min⁡ai∈S(ai)∑T⊆S,T≠∅(−1)∣T∣−1max⁡ai∈T(ai)\min_{a_i\in S}(a_i)\sum_{T\sub…

使用帆软制作项目

https://zhuanlan.zhihu.com/p/23429318335 项目背景 为加快大数据体系建设&#xff0c;稳步推进数字化转型战略&#xff0c;规范数据架构体系和数据治理体系&#xff0c;运用大数据推进全行数字化转型建设&#xff0c;为业务发展提供创新动力&#xff0c;目标是利用金融科技和…

论C/C++的条件编译#if、#ifdef、#ifndef、#undef

我们以实例来演示&#xff1a; ------------------------------------------实验①------------------------------------------ 子函数&#xff1a;主函数&#xff1a;当定义了COMMENT_FLAG该宏&#xff0c;且其为0&#xff0c;则运行结果如下&#xff1a;只执行了sub_func_1函…

21、鸿蒙Harmony Next开发:组件导航(Navigation)

目录 设置页面显示模式 设置标题栏模式 设置菜单栏 设置工具栏 路由操作 页面跳转 页面返回 页面替换 页面删除 移动页面 参数获取 路由拦截 单例跳转 子页面 页面显示类型 页面生命周期 页面监听和查询 页面转场 关闭转场 自定义转场 共享元素转场 跨包…

“外卖大战”正在改变国内“大零售”

出品 | 何玺排版 | 叶媛7月18日&#xff0c;市场监管总局约谈美团、饿了么、京东三家外卖平台&#xff0c;要求“理性竞争、规范促销”&#xff0c;剑指近期愈演愈烈的“0元购”“0.1秒杀”等外卖补贴乱象。但约谈之后&#xff0c;平台们是真整改&#xff0c;还是玩话术&#x…

当CAN握手EtherCAT:视觉检测系统的“双芯合璧”时代来了

在汽车制造的高速生产线上&#xff0c;设备间的“语言不通”曾是工程师们的头疼事&#xff1a;CAN总线像踏实的老司机&#xff0c;稳扎稳打传输传感器数据&#xff1b;而EtherCAT网关则是追求极致速度的“闪电侠”&#xff0c;主导着实时控制的重任。当视觉检测系统需要同时对接…

【C语言】动态内存管理全解析:malloc、calloc、realloc与free的正确使用

C语言学习 动态内存分配 友情链接&#xff1a;C语言专栏 文章目录C语言学习前言&#xff1a;一、为什么要有动态内存分配二、malloc和free2.1 malloc2.2 free三、calloc和realloc3.1 calloc3.2 realloc总结附录上文链接下文链接专栏前言&#xff1a; 在C语言编程中&#xff0…

基于Arduino智能家居环境监测系统—以光照强度检测修改

2 相关技术与理论 2.1 Arduino 技术 Arduino 是一款广受欢迎的开源电子原型平台&#xff0c;由硬件和软件组成&#xff0c;为开发者提供了便捷且低成本的解决方案&#xff0c;尤其适用于快速搭建交互式电子项目&#xff0c;在本智能家居环境监测系统中担当核心角色。​ 硬件方…

前端上传 pdf 文件 ,前端自己解析出来 生成界面 然后支持编辑

要在前端解析 PDF 文件并生成可编辑界面&#xff0c;我们可以使用 PDF.js 库来解析 PDF 内容&#xff0c;然后将其转换为可编辑的 HTML 元素。 主要特点和工作原理如下&#xff1a; PDF 解析&#xff1a; 使用 Mozilla 的 PDF.js 库解析 PDF 文件内容&#xff0c;提取文本信息。…

Linux“一切皆文件“设计哲学 与 Linux文件抽象层:struct file与file_operations的架构解析

在Linux系统中&#xff0c;“一切皆文件”&#xff08;Everything is a file&#xff09;是一个核心设计哲学&#xff0c;它抽象了系统资源的访问方式&#xff0c;使得几乎所有硬件设备、进程、网络连接等都可以通过统一的文件接口&#xff08;如open()、read()、write()、clos…

蓝桥杯零基础到获奖-第3章 C++ 变量和常量

蓝桥杯零基础到获奖-第3章 C 变量和常量 文章目录一、变量和常量1.变量的创建2.变量初始化3.变量的分类4.常量4.1 字⾯常量4.2 #define定义常量4.3 const 定义常量4.4 练习练习1&#xff1a;买票https://www.nowcoder.com/practice/0ad8f1c0d7b84c6d8c560298f91d5e66练习2&…

物理AI是什么技术?

当英伟达CEO黄仁勋在链博会上明确提出“物理AI将是AI的下一浪潮”时&#xff0c;这个看似陌生的概念瞬间引发了科技圈的广泛关注。究竟什么是物理AI&#xff1f;它与我们熟悉的人工智能有何不同&#xff1f;又将如何重塑我们与物理世界的交互方式&#xff1f; 物理AI&#xff1…

GRIB数据处理相关指令

GRIB 数据格式简介 GRIB(General Regularly distributed Information in Binary form)&#xff0c;是由世界气象组织&#xff08;WMO&#xff09;设计和维护的一种用于存储和传输网格数据的标准数据格式&#xff0c;它是一种自描述的二进制压缩格式&#xff0c;通常具有扩展名…

微服务学习(六)之分布式事务

微服务学习&#xff08;六&#xff09;之分布式事务一、认识Seata二、部署TC服务1、准备数据库表2、准备配置文件3、docker部署三、微服务集成seata1、引入依赖2、改造配置3、添加数据库表4、测试四、XA模式1、两阶段提交2、seata的XA模型3、优缺点4、实现步骤五、AT模式1、Sea…