引言

前序学习进程中,已经对最佳超平面的求解有了一定认识。
刚好在此梳理一下:

函数距离

首先有函数距离F,也可以称为函数间隔F:
F=min⁡i=1...myi(w⋅xi+b)F= \min_{i=1...m}y_{i}(w \cdot x_{i}+b)F=i=1...mminyi(wxi+b)

几何距离

然后有几何距离δ,也可以称为几何间隔δ:
δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delta=\min_{i=1...m}y_{i}(\frac{w}{\left\|w\right\|} \cdot x_{i}+\frac{b}{\left\|w\right\|}) δ=i=1...mminyi(wwxi+wb)
很显然,几何距离δ和函数距离F之间只相差一个量||w||:
δ=F∥w∥\delta=\frac{F}{\left\|w\right\|}δ=wF然后我们再次回忆最佳超平面的寻找过程:

第一步,一个特定超平面的周围会有很多点,通过计算后会获得不同的几何距离,取出这些距离中的最小值;
第二步,遍历所有可能的超平面,重复步骤一;
第三步:在前两步的基础上,在取出的所有几何距离中,选取最大值对应的超平面为最优超平面。

这是一个稍微有点绕的过程,首先是每个备选超平面都选取最小几何距离,然后是在所有最小几何距离中挑出最大值,取这个最大的几何距离对应的超平面为最佳超平面。可以总结为:在最小值集合中挑选最大值。
为了寻找这个最大值,我们联想到同比率变换权重矩阵w和偏置量b不会改变几何距离,因此有一种巧妙的解法:
通过同比率调整权重矩阵w和偏置量b,使得函数距离F=1,这个时候最佳超平面对应的最大几何距离δmax满足:
δmax=max⁡i=1...m1∥w∥\delta_{max}=\max_{i=1...m}\frac{1}{\left\|w\right\|}δmax=i=1...mmaxw1
为求解这个最佳超平面对应的最大几何距离,一种更好理解的思路被提出来,把寻找过程中的除法转化为了乘法,定义距离函数f:
f=mini=1...m12∥w∥2f=min_{i=1...m}\frac{1}{2}{\left\|w\right\|}^2f=mini=1...m21w2这篇文章的学习任务,就是梳理距离函数f的最佳解法:拉格朗日乘数法。

拉格朗日乘数法

拉格朗日乘数法的构造需要两个前提条件,一个是目标函数,比如此处的距离函数f,另一个是约束函数,可以定义为g。
关于f和g,展开如下讨论:
f和g在任意位置的梯度都指向它们增长最快的方向,和它们本身的图像垂直;
对于目标函数f,它取特定值的时候,结果可能绘制出一条闭合的等高线,也可能是孤立的点。对于孤立的点,法向量是(0,0);对于等高线,可以记录任意一点的梯度为▽f\bigtriangledown ff
目标函数f和约束函数g可能有很多交点,但当目标函数取极值的时候,一定会满足条件:▽f=λ▽g\bigtriangledown f=\lambda \bigtriangledown gf=λg
为解释这个梯度平行的条件,我们这样想:
将f的梯度▽f\bigtriangledown ff分解到互相垂直的▽g\bigtriangledown gg和g的切线方向vvv上,此时沿着vvv的方向只要还有f的梯度,就表明f的取值还可以继续改变;
▽f\bigtriangledown ffvvv上没有任何分量时,f只能在垂直g的方向上增长,也就是沿着约束函数g再也无法改变f。
当然,f的取值也无法脱离g的约束,所以▽f\bigtriangledown ffvvv上没有任何分量时,f就取到了极值,此时f的法向量垂直于g,g的法向量自然也垂直于g,这两个法向量平行,所以一定有:
▽f=λ▽g\bigtriangledown f=\lambda\bigtriangledown gf=λg

当f为孤立点时,λ=0,上式依然满足。
为辅助理解,求助了deepseek,它提供了一张图,放在这里和大家共享,也可复制链接直达原图:https://upload.wikimedia.org/wikipedia/commons/thumb/f/fa/Lagrange_multiplier.png/300px-Lagrange_multiplier.png等高线图和约束

总结

学习了一下拉格朗日乘数法的基本概念。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/915219.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/915219.shtml
英文地址,请注明出处:http://en.pswp.cn/news/915219.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vscode 源码编译

windows 环境 下载安装 build tools Visual Studio Build Tools 勾选 C 因为安装详细信息里是 v143,所以单个组件里也要追加两个 143 的勾选 点击安装,安装好重启下电脑 Electron 安装失败:connect ETIMEDOUT 20.205.243.166:443 为防Ele…

读取和写入json,xml文件

一、JSON文件操作​ 1. 核心类​​ ​​QJsonDocument​​:表示整个JSON文档,提供解析(fromJson())和序列化(toJson())功能。 ​​QJsonObject​​:存储键值对集合,支持嵌套对象和数…

深度学习×第10卷:她用一块小滤镜,在图像中找到你

🌈【第一节 她看到的是像素点,却试图拼出你整张脸】📸 图像是什么?她从未见过你,但看见的是你的一片光斑图像,在神经网络的眼里,是一个个数字格子。这些格子,每个都有 0~255 的亮度…

计算机组成原理中的RAM:核心技术深度解析

摘要:本文深度剖析RAM在计算机体系中的核心地位,结合2025年最新技术标准与实测数据,涵盖DRAM工作原理、主流技术对比、非易失性存储革新及未来发展趋势,为硬件开发者和系统架构师提供权威技术参考。一、RAM基础原理与系统交互机制…

C语言—深入理解指针(详)

深入理解指针(详解)前言一、指针是什么1、指针的定义2、指针的大小二、指针类型1、类型2、不同类型的意义三、野指针1、野指针形成原因2、如何避免野指针四、指针的运算1、 指针整数2、指针-指针3、指针的关系运算五、const修饰指针1、consr修饰变量2、c…

小谈相机的学习过程

前言博主本人并非专职相机开发,还涉及系统的其他几个模块,虽然都属于owner,但是都还在学习探索的一个过程,自认为掌握还不够细致,此篇文章仅梳理,总结,印证自己近五年相机模块的一个学习过程&am…

CentOS7 内网服务器yum修改

1、首先确定的内网服务器是有yum源代理服务器的2、修改 /etc/yum.conf 配置文件,增加代理ip和端口号proxyhttp://ip.ip.ip.ip:port3、备份源是文件sudo cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak4、修改配置文件 vi CentOS-Base…

基于单片机自行车自动防盗报警系统设计

摘 要 本文阐述了自行车防盗报警系统原理,介绍如何用stc89c52单片机实现防盗报警,分析各个部分的工作原理,并给出了原理图和源程序。此设计电路由震动传感器、单片机、无线超再生发射/接收电路、LED显示器和蜂鸣器组成。由于超再生接收是一种…

【深度学习】神经网络反向传播算法-part4

七、反向传播算法反向传播Back Propagation 简称 BP 。 训练神经网络的核心算法之一,通过计算损失函数,相对于每个权重参数的梯度,来优化神经网络的权重1. 前向传播前向传播是把数据经过各层神经元的运算并逐层向前传输,知道输出层…

CTF之服务器端模板注入(SSTI)与赛题

概念定义服务器端模板注入(Server-Side Template Injection)服务端接受攻击者的输入,将其作为Web应用内容的一部分,在进行代码编译渲染的过程中,进行了语句的拼接,执行了所插入的恶意内容,从而导致信息泄露、代码执行、…

除了某信,就是这款软件来替代了!

引言 哈喽,我是小索奇。有时候会有一个普遍的需求,想在几个设备之间传个文件或者发个消息,除了微信,想一想你还能用什么软件? 今天就是为了解决这个问题,给大家介绍一款软件 Localsend 来解决。 内容模块…

Vue2.x封装预览PDF组件

一、为什么用PDFObject插件? PDFObject 是一个轻量级的 JavaScript 库,主要用于在网页中嵌入和预览 PDF 文件。它通过简单的 API 调用,可以在浏览器中实现 PDF 文件的显示,而无需依赖任何插件。以下将详细介绍 PDFObject 的特点、…

undefined reference to ‘end‘

相关问题: 一、undefined reference to _exit undefined reference to ‘end‘ warning: _close is not implemented and will always fail 一、环境: ubuntu24.04实体机、 arm-none-eabi-gcc gcc version 13.2.1 20231009 (15:13.2.rel1-2) 二…

nginx定制http头信息

修改http响应头信息,相关Nginx模块:ngx_http_headers_moduleexpires语法:expires [modified] time;expires [modified] time;默认值:expires off;作用域:http, server, location, if in location用途:控制缓…

主机安全---开源wazuh安装

Wazuh 简介 Wazuh 是一款免费开源的终端安全监控平台,支持威胁检测、完整性监控、事件响应和合规性管理,适用于企业级安全运维场景。其核心组件包括: Wazuh Indexer:基于 OpenSearch 的日志存储与检索组件。Wazuh Server&#x…

GaussDB 数据库架构师修炼(四) 备份容量估算

1 影响备份容量关键要素业务总数据量备份数据保留周期备份周期备份数据的压缩比平均每天的新增数据量平均每天新增日志数据量2 备份容量的估算方法公式备份容量C = 自动全量备份容量C1 + 自动差量备份容量C2 + 自动日志归档 容量C3 &#xff…

《R for Data Science (2e)》免费中文翻译 (第0章) --- Introduction

写在前面 本系列推文为《R for Data Science (2e)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn…

如何 ASP.NET Core 中使用 WebSocket

如何在 ASP.NET Core 中使用 WebSocket在现代 Web 应用程序中,WebSocket 连接非常流行且使用率极高。它可以帮助企业满足数字环境需求,并处理来自最终用户的实时数据。它还能提升生产力、输出率和用户体验。如果您还没有使用 WebSocket,那么您…

Python之--元组

定义是 Python 中内置的不可变序列。在 Python 中使用()定义元组,元素与元素之间使用英文的逗号分隔。元组中只有一个元素的时候,逗号也不能省略。元组的创建方式(1)使用()直接创建元…

工业相机GigE数据接口的优势及应用

工业相机不同的数据接口适用的应用场景也不同,选择合适的数据额接口,可大大提高效率。今天我们来看看常见的GigE接口的优势及应用。基于GigE Vision标准的千兆以太网(GigE)相机通过提供快速、灵活且成本效益高的成像解决方案&…