一、核心基础概念

  1. 核心目标:在样本空间中找到划分超平面,将不同类别样本分开,且该超平面对训练样本局部扰动的 “容忍性” 最优(即抗干扰能力强)。
  2. 超平面定义
    • 超平面是 n 维空间中的 n-1 维子空间,是 SVM 分类的核心依据:
      • 3 维空间中,超平面为 2 维平面;2 维空间中,超平面为 1 维直线。
      • 数学表达式:wTx+b=0,其中w是 n 维向量(超平面法向量),b是实数(超平面截距),x是样本向量。
  3. 关键指标:Margin(间隔)与支持向量
    • Margin(间隔):两类样本中距离超平面最近的点到超平面距离的 2 倍(Margin=2d,d为最近点到超平面的距离),SVM 的核心优化目标是最大化 Margin,以提升模型泛化能力。
    • 支持向量:距离超平面最近的样本点,是决定超平面位置的关键样本,其他样本对超平面无影响。
  4. 样本标签与决策方程
    • 样本标签:正例标注为y=+1,负例标注为y=−1,便于后续约束条件推导。
    • 决策方程:y(x)=w⋅Φ(x)+b,其中Φ(x)是样本x的特征映射(用于解决低维不可分问题,后续详细说明),若y(x)>0预测为正例,y(x)<0预测为负例。

二、核心优化逻辑

(一)优化目标推导

  1. 初始目标:最大化间隔Margin=2d,等价于最大化单个最近点到超平面的距离d。
  2. 点到超平面距离公式:n 维空间中,样本x到超平面wTx+b=0的距离为d=wTw​∣wTx+b∣​。
  3. 约束条件简化:通过对w和b进行放缩变换,使所有样本满足yi​⋅(w⋅Φ(xi​)+b)≥1(保证所有样本在超平面 “正确一侧”,且支持向量满足等号yi​⋅(w⋅Φ(xi​)+b)=1)。
  4. 目标函数转换:最大化d=wTw​1​(由距离公式及约束条件推导),等价于最小化21​wTw(将极大值问题转化为更易求解的极小值问题,且平方项可简化计算)。

(二)带约束优化求解:拉格朗日乘子法

  1. 优化问题形式
    • 目标函数(极小化):minw,b​21​wTw
    • 约束条件(不等式):yi​⋅(w⋅Φ(xi​)+b)≥1(i=1,2,...,n,n为样本数)
  2. 拉格朗日函数构建:引入拉格朗日乘子αi​≥0,将带约束优化转化为无约束优化,函数形式为:L(w,b,α)=21​wTw−∑i=1n​αi​[yi​⋅(w⋅Φ(xi​)+b)−1]
  3. 求解关键条件:对w和b求偏导并令其等于 0,得到核心等式:
    • w=∑i=1n​αi​yi​Φ(xi​)(w由支持向量的αi​、yi​和Φ(xi​)决定)
    • ∑i=1n​αi​yi​=0(αi​的约束条件)
  4. 对偶问题转化:将w的表达式代入拉格朗日函数,原问题转化为对偶问题 ——最大化∑i=1n​αi​−21​∑i=1n​∑j=1n​αi​αj​yi​yj​Φ(xi​)TΦ(xj​),约束条件为∑i=1n​αi​yi​=0且αi​≥0。

三、关键拓展:解决实际问题

(一)软间隔:应对噪声与非完全可分数据

  1. 问题背景:现实数据常存在噪声,硬间隔(要求所有样本满足yi​⋅(w⋅Φ(xi​)+b)≥1)会导致超平面划分效果差。
  2. 解决方案:引入松弛因子ξi​
    • 调整约束条件:yi​⋅(w⋅Φ(xi​)+b)≥1−ξi​(ξi​≥0,ξi​越大,允许样本偏离 “理想位置” 越多)。
    • 调整目标函数:minw,b,ξ​21​wTw+C∑i=1n​ξi​,其中C是惩罚参数:
      • C趋近于极大值:惩罚强,不允许样本偏离,等价于硬间隔。
      • C趋近于极小值:惩罚弱,允许更多样本偏离,避免过拟合。
  3. 软间隔对偶求解:约束条件变为0≤αi​≤C(原硬间隔αi​≥0),其余求解逻辑与硬间隔一致。

(二)核变换:解决低维不可分问题

  1. 问题背景:部分数据在低维空间中无法用线性超平面分离(如环形分布数据)。
  2. 核心思路:通过特征映射Φ(x)将低维输入空间的样本映射到高维特征空间,使数据在高维空间中线性可分。
  3. 核函数:避免高维计算灾难
    • 问题:高维空间中计算Φ(xi​)TΦ(xj​)(内积)复杂度极高(如 3 维映射到 9 维,复杂度为O(n2))。
    • 解决方案:引入核函数K(xi​,xj​)=Φ(xi​)TΦ(xj​),直接在低维空间计算,等价于高维空间内积,降低计算成本。
  4. 常见核函数
    • 线性核函数:适用于线性可分数据,K(xi​,xj​)=xiT​xj​。
    • 高斯核函数(RBF 核):适用于非线性可分数据,能将数据映射到无限维空间,K(xi​,xj​)=exp(−2σ2∥xi​−xj​∥2​)(σ为带宽参数,影响核函数平滑度)。

四、总结

支持向量机以 “最大化间隔” 为核心优化目标,通过硬间隔(线性可分)、软间隔(应对噪声)、核变换(应对非线性)三大策略,适配不同数据场景;求解过程依赖拉格朗日乘子法与对偶问题转化,最终仅通过支持向量即可确定超平面,具备模型简洁、泛化能力强的优势,是分类任务中的经典且高效算法。

五、代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/920705.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/920705.shtml
英文地址,请注明出处:http://en.pswp.cn/news/920705.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spark学习记录

1、Spark基础介绍 1.1、Spark基础概念 Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎 1.2、Spark运行架构 运行过程&#xff1a; Driver 执行用户程序&#xff08;Application&#xff09;的main()方法并创建 SparkContext&#xff0c;与 Cluster Manager 建…

二进制方式安装部署 Logstash

背景说明 Logstash 是一个开源的数据收集和处理引擎&#xff0c;是 Elastic Stack 的重要组件之一。在本方案中&#xff0c;我们使用 Logstash 作为 Kubernetes 集群日志收集的关键组件&#xff0c;主要用于&#xff1a; 从 Kafka 消费各服务的日志数据对日志数据进行过滤和转…

如何用 Kotlin 在 Android 手机开发一个计算器

使用 Kotlin 开发 Android 计算器1. 创建新项目 打开 Android Studio&#xff0c;选择新建项目&#xff0c;模板选择 "Empty Activity"&#xff0c;语言选择 Kotlin&#xff0c;确保最低 API 级别为 21 或更高。2. 设计用户界面 在 res/layout/activity_main.xml 中定…

【Hadoop】Zookeeper、HBase、Sqoop

Zookeeper概述Zookeeper可以监视HDFS系统的name node和data node&#xff0c;HBase也极度依赖zookeeper&#xff0c;因为zookeeper维护了HBase的源数据以及监控所有region server的健康状态&#xff0c;如果region server宕机会通知master 。它也可以避免脑裂&#xff08;只有一…

MLIR - Linalg

简介 Linalg是MLIR中的HHO&#xff08;High-level Hierarchical Optimization&#xff09;中的核心方言&#xff0c;设计用于支持如下的核心Transformation&#xff1a; Progressive Buffer Allocation.Parametric Tiling.Promotion to Temporary Buffer in Fast Memory.Tile…

SQL相关知识 CTF SQL注入做题方法总结

SQL MySQL基础 MySQL基本操作 1.查询本地所有数据库&#xff1a; show databases; 2.使用数据库&#xff1a;use 数据库名; 3.查看当前使用的数据库名&#xff1a;select database(); 4.查看当前使用的数据库的所有表&#xff1a;show tables; 5.查看数据库版本&#xff1a;sel…

魔方的使用

三阶魔方入门玩法教程 【简单实用11个公式】三阶魔方分步还原公式图解 【初级篇】三阶魔方入门教程 1、底棱归位&#xff08;底十字对中层&#xff09; 先顶黄白十字&#xff0c;旋转对齐中层后&#xff0c;R’2翻到底层 2、底角归位 上右-前-》右下 &#xff1a;URU’R’…

新手友好!剪映:开启你的视频剪辑之旅!(国际版)

一.软件介绍 剪映&#xff08;CapCut&#xff09;是一款由​​抖音旗下深圳市脸萌科技有限公司​​开发的全功能视频编辑软件&#xff0c;自2019年5月上线以来&#xff0c;因其简单易用且功能强大&#xff0c;受到了大量用户的喜爱。 1.功能和作用&#xff1a; 功能类别主要…

使用AI大模型Seed1.5-VL精准识别开车接打电话等交通违法行为

原文链接 本案例根据用户上传的电子警察或道路卡口抓拍的图片,使用豆包全新视觉深度思考模型Doubao-1.5-thinking-vision-pro,精准识别车牌号码、车牌颜色、车身颜色、车辆品牌等车辆信息,同时通过算法精确识别开车打电话、未系安全带等交通违法行为,具有极强的实用价值。…

骑行商城怎么开发

随着骑行运动普及与数字化消费升级&#xff0c;“骑行中控数据变现积分商城”模式成为新趋势。以下从核心步骤、关键要点、风险规避三方面&#xff0c;详解如何搭建该类型小程序。一、明确核心架构与需求定位在开发前需确定小程序的核心逻辑与目标用户&#xff0c;避免功能冗余…

揭秘表格推理的“思维革命”:RoT模型介绍

–– RoT: Enhancing Table Reasoning with Iterative Row-Wise Traversals今天&#xff0c;我想和大家探讨一个我们每天都会遇到&#xff0c;却可能从未深思过其背后奥秘的事物——表格。从公司的财务报表、医疗数据&#xff0c;到体育赛事统计&#xff0c;表格无处不在&#…

【C++】AVL树(详解)

文章目录 上文链接一、什么是 AVL 树二、AVL 树的实现1. 引入平衡因子2. 整体结构3. AVL 树中的插入操作(1) 插入节点(2) 更新平衡因子更新规则停止更新条件 4. 旋转(1) 旋转的目的(2) 右单旋(3) 左单旋(4) 左右双旋(5) 右左双旋 5. AVL 树的查找与删除6. AVL 树的平衡检测 三、…

shell编程-核心变量知识

文章目录shell简介如何学好shell初识shell什么是shell执行shell脚本常用的三种方式shell变量变量相关的配置文件变量的定义shell核心位置变量shell简介 为什么学习shell&#xff0c;shell的作用 面试题&#xff1a;给你一台主机你的操作流程是什么&#xff1f; 1.自动化安装操…

微电网调度(风、光、储能、电网交互)(MatlabPython代码实现)

赠读者&#xff1a;正在埋头科研的你&#xff0c;或许有时你会困惑于 “投入” 与 “回报” 的时差&#xff0c;会疲惫于 “未知” 与 “确定” 的博弈&#xff0c;但请记得&#xff1a;那些看似 “无用” 的试错&#xff0c;都是在为突破搭建阶梯&#xff1b;那些独自深耕的日…

CentOS 7 环境下安装 JDK 1.8 及解决 wget 命令缺失问题

个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务) &#x1f48c;个人邮箱&#xff1a;[2435024119qq.com] &#x1f4f1;个人微信&a…

psql介绍(PostgreSQL命令行工具)(pgAdmin内置、DBeaver、Azure Data Studio)数据库命令行工具

文章目录**1. psql 的核心功能**- **交互式操作**&#xff1a;通过命令行直接与 PostgreSQL 服务器交互&#xff0c;执行 SQL 查询和管理命令。- **元命令支持**&#xff1a;提供以 \ 开头的特殊命令&#xff08;如 \l、\d、\connect&#xff09;&#xff0c;用于管理数据库对象…

设计模式9-责任链模式

定义 Chain of Responsibility Pattern&#xff1a;使多个对象都有机会处理请求&#xff0c;从而避免了请求的发送者和接受者之间的耦合关系。将这些对象连成一条链&#xff0c; 并沿着这条链传递该请求&#xff0c;直到有对象处理它为止。 优势 解耦请求发送者与接收者&#…

使用JAVA制作minecraft红石和创造模式插件

这一次主要是红石和创造模式的新加入由于代码较长&#xff0c;所以呃这一段代码就直接劳烦各位呃插进之前的3.0版本里面!!!!!!!!!import org.lwjgl.*; import org.lwjgl.glfw.*; import org.lwjgl.opengl.*; import org.lwjgl.system.*;import java.nio.*; import java.util.*;…

Git 版本管理核心实践与问题解决手册

Git 的核心价值版本控制&#xff1a;完整记录所有修改历史&#xff0c;支持随时回退到任意历史版本团队协作&#xff1a;允许多开发者同时工作&#xff0c;有效避免代码冲突和覆盖问题高效分支&#xff1a;通过分支隔离功能开发与稳定主线&#xff0c;保持项目稳定性变更追溯&a…

hadoop安欣医院挂号看诊管理系统(代码+数据库+LW)

摘 要 随着信息技术的飞速发展&#xff0c;医疗服务行业正逐步向信息化、智能化转型。安欣医院挂号看诊管理系统正是基于这一背景开发的一款集挂号、看诊管理于一体的综合性系统。本系统采用Hadoop大数据处理技术&#xff0c;旨在提高医院挂号看诊的效率&#xff0c;优化医疗…