上一章:机器学习02——模型评估与选择
下一章:机器学习04——决策树
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

文章目录

      • 一、线性模型的基本形式
        • (一)数学表达
        • (二)核心优点
      • 二、线性回归
        • (一)单一属性线性回归
        • (二)多元线性回归
        • (三)离散属性的处理
      • 三、广义线性模型
        • (一)对数线性回归
        • (二)一般形式
      • 四、二分类任务
        • (一)函数选择
        • (二)对数几率回归
      • 五、线性判别分析(LDA)
        • (一)核心思想
        • (二)数学定义与优化目标
        • (三)多分类扩展
      • 六、优化方法总结

一、线性模型的基本形式

(一)数学表达
  • 一般形式:对于包含d个属性的样本x=(x1;x2;...;xd)x=(x_1; x_2; ...; x_d)x=(x1;x2;...;xd),线性模型的输出为:
    f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1 x_1 + w_2 x_2 + ... + w_d x_d + bf(x)=w1x1+w2x2+...+wdxd+b
    其中,w1,w2,...,wdw_1, w_2, ..., w_dw1,w2,...,wd为属性权重(反映对应属性的重要性),b为偏置项。
  • 向量形式:将权重表示为向量w=(w1;w2;...;wd)w=(w_1; w_2; ...; w_d)w=(w1;w2;...;wd),则模型可简化为:
    f(x)=wTx+bf(x)=w^T x + bf(x)=wTx+b
    wTw^TwT为w的转置)。
(二)核心优点
  • 形式简单、易于建模:仅通过线性组合即可构建模型,计算复杂度低;
  • 可解释性强:权重wiw_iwi的大小直接反映对应属性对输出的影响程度(如“判断西瓜好坏”的模型中,根蒂的权重最大,说明根蒂是最关键的特征);
  • 非线性模型的基础:通过引入层级结构(如神经网络)或高维映射(如核方法),可扩展为复杂的非线性模型。

二、线性回归

线性回归旨在学习一个线性模型,以准确预测实值输出标记,核心是通过最小二乘法估计参数。

(一)单一属性线性回归
  • 目标:对于样本(xi,yi)(x_i, y_i)(xi,yi),学习f(x)=wx+bf(x)=wx + bf(x)=wx+b,使f(xi)≃yif(x_i) \simeq y_if(xi)yi
  • 参数估计(最小二乘法)
    最小化均方误差(预测值与真实值的平方和):
    (w∗,b∗)=argmin(w,b)∑i=1m(yi−wxi−b)2(w^*, b^*) = \underset{(w,b)}{argmin} \sum_{i=1}^m (y_i - wx_i - b)^2(w,b)=(w,b)argmini=1m(yiwxib)2
    通过对w和b求导并令导数为0,可得闭式解:
    w=∑i=1myi(xi−x‾)∑i=1mxi2−1m(∑i=1mxi)2,b=1m∑i=1m(yi−wxi)w = \frac{\sum_{i=1}^m y_i(x_i - \overline{x})}{\sum_{i=1}^m x_i^2 - \frac{1}{m}(\sum_{i=1}^m x_i)^2}, \quad b = \frac{1}{m}\sum_{i=1}^m (y_i - wx_i)w=i=1mxi2m1(i=1mxi)2i=1myi(xix),b=m1i=1m(yiwxi)
    其中x‾=1m∑i=1mxi\overline{x} = \frac{1}{m}\sum_{i=1}^m x_ix=m1i=1mxi为样本均值。
(二)多元线性回归
  • 目标:对于含d个属性的样本xi=(xi1;...;xid)x_i=(x_{i1}; ...; x_{id})xi=(xi1;...;xid),学习f(xi)=wTxi+bf(x_i)=w^T x_i + bf(xi)=wTxi+b,使f(xi)≃yif(x_i) \simeq y_if(xi)yi
  • 矩阵表示:将w和b合并为向量w^=(w;b)\hat{w}=(w; b)w^=(w;b),数据集表示为矩阵XXX(每行含样本属性及常数1),输出为向量y=(y1;...;ym)y=(y_1; ...; y_m)y=(y1;...;ym)
  • 参数估计:通过最小二乘法最小化(y−Xw^)T(y−Xw^)(y - X\hat{w})^T(y - X\hat{w})(yXw^)T(yXw^),当XTXX^T XXTX为满秩矩阵时,闭式解为:
    w^∗=(XTX)−1XTy\hat{w}^* = (X^T X)^{-1} X^T yw^=(XTX)1XTy
    XTXX^T XXTX非满秩(如属性数多于样本数),需通过归纳偏好(如选择最简单解)或正则化处理。
(三)离散属性的处理
  • 有序属性:直接连续化为数值(如“小/中/大”转换为“1/2/3”);
  • 无序属性:若有k个取值,转换为k维向量(如“红/绿/蓝”转换为“(1,0,0)/(0,1,0)/(0,0,1)”)。

三、广义线性模型

线性回归可通过联系函数扩展到非线性输出场景,形成广义线性模型。

(一)对数线性回归

在这里插入图片描述

  • 当输出标记y与线性模型的关系为对数形式时:
    ln⁡y=wTx+b⟹y=ewTx+b\ln y = w^T x + b \implies y = e^{w^T x + b}lny=wTx+by=ewTx+b
    此时模型可拟合指数增长的输出(如人口增长、商品销量)。
(二)一般形式
  • 广义线性模型定义为:
    y=g−1(wTx+b)y = g^{-1}(w^T x + b)y=g1(wTx+b)
    其中g(⋅)g(\cdot)g()联系函数(单调可微函数),作用是将线性模型的输出映射到目标变量的取值空间。对数线性回归是其特例(g(⋅)=ln⁡(⋅)g(\cdot)=\ln(\cdot)g()=ln())。

四、二分类任务

二分类任务需将线性模型输出z=wTx+bz=w^T x + bz=wTx+b映射到离散标记y∈{0,1}y \in \{0,1\}y{0,1},核心是选择合适的映射函数。

(一)函数选择

在这里插入图片描述

  • 单位阶跃函数:理想映射函数,但因不连续(在z=0处突变),无法用于参数学习:
    y={0,z<00.5,z=01,z>0y = \begin{cases} 0, & z < 0 \\ 0.5, & z = 0 \\ 1, & z > 0 \end{cases}y=0,0.5,1,z<0z=0z>0
  • 对数几率函数(替代函数):单调可微的Sigmoid函数,可近似单位阶跃函数:
    y=11+e−z=11+e−(wTx+b)y = \frac{1}{1 + e^{-z}} = \frac{1}{1 + e^{-(w^T x + b)}}y=1+ez1=1+e(wTx+b)1
    其本质是将线性输出z转换为[0,1]区间的概率(样本为正例的概率)。
(二)对数几率回归
  • 核心思想:通过对数几率(正例与反例的相对可能性的对数)建立线性关系:
    ln⁡y1−y=wTx+b\ln \frac{y}{1 - y} = w^T x + bln1yy=wTx+b
    y1−y\frac{y}{1 - y}1yy为正例的“优势比”);
  • 优点
    • 无需假设数据分布;
    • 可直接输出类别概率,便于决策;
    • 可用梯度下降、牛顿法等数值优化算法求解参数。

五、线性判别分析(LDA)

在这里插入图片描述

LDA是一种监督学习方法,通过将样本投影到一条直线上,实现类别分离(同类样本投影点接近,异类远离)。

(一)核心思想
  • 同类紧凑:使同类样本的投影点协方差最小(聚在一起);
  • 异类分离:使不同类样本的投影中心距离最大(分开)。
(二)数学定义与优化目标
  • 关键变量
    • 类均值向量μ0,μ1\mu_0, \mu_1μ0,μ1(两类样本的中心);
    • 类内散度矩阵Sw=∑0+∑1S_w = \sum_0 + \sum_1Sw=0+1(衡量同类样本的分散程度);
    • 类间散度矩阵Sb=(μ0−μ1)(μ0−μ1)TS_b = (\mu_0 - \mu_1)(\mu_0 - \mu_1)^TSb=(μ0μ1)(μ0μ1)T(衡量两类中心的距离);
  • 优化目标:最大化投影后的“类间距离/类内散度”:
    J(w)=wTSbwwTSwwJ(w) = \frac{w^T S_b w}{w^T S_w w}J(w)=wTSwwwTSbw
    (广义瑞利商,通过拉格朗日乘子法求解);
  • 最优解w=Sw−1(μ0−μ1)w = S_w^{-1}(\mu_0 - \mu_1)w=Sw1(μ0μ1)(投影方向与两类中心差成正比,与类内散度成反比)。
(三)多分类扩展
  • 对于N类任务,LDA将样本投影到N-1维空间(维度低于原属性数),本质是监督降维技术;
  • 优化目标扩展为最大化“类间散度矩阵迹/类内散度矩阵迹”,参数解为Sw−1SbS_w^{-1} S_bSw1Sb的前N-1个最大广义特征值对应的特征向量。

六、优化方法总结

不同线性模型的优化目标与求解方法如下:

模型优化目标求解方法
线性回归最小化均方误差线性代数(闭式解)
对数几率回归最大化样本似然(等价于最小化交叉熵)凸优化(梯度下降、牛顿法)
LDA最大化类间散度/类内散度矩阵论(广义瑞利商)

上一章:机器学习02——模型评估与选择
下一章:机器学习04——决策树
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921827.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921827.shtml
英文地址,请注明出处:http://en.pswp.cn/news/921827.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

qt QLineSeries详解

1、概述QLineSeries是Qt Charts模块中的一个重要类&#xff0c;用于绘制折线图。它是QXYSeries的实现类&#xff0c;将信息显示为由直线连接的一系列数据点。该类为QAbstractSeries的子类&#xff0c;因此可以通过该类来访问QAbstractSeries的所有公共方法和属性。2、重要方法c…

你再也找不到更详细的3DGS教程了 —— 一万九千字长文解析3DGS

参考: https://www.bilibili.com/video/BV1MF4m1V7e3/ https://blog.csdn.net/2401_86810419/article/details/148811121 https://www.bilibili.com/video/BV1cz421872F?t=233.9 https://wuli.wiki/online/SphHar.html https://zhuanlan.zhihu.com/p/467466131 特别指出…

Python,遗传算法与神经网络架构搜索:基于DEAP的自动模型设计

引言&#xff1a;当进化论遇见深度学习——自动化的黎明在深度学习的蛮荒时代&#xff0c;我们是“手工匠人”。我们依靠直觉、前辈的经验&#xff08;ResNet 为什么是152层而不是153层&#xff1f;&#xff09;、大量的试错以及那么一点点玄学&#xff0c;在架构的黑暗森林中摸…

Vue框架技术详解——项目驱动概念理解【前端】【Vue】

Vue3框架 是前端渲染框架浏览器向服务器第一次发送请求&#xff0c;就会将所有页面的样式全部返回到浏览器vue中会将所有js文件最后打包成一个js文件&#xff0c;当前访问其中一个页面时&#xff0c;其他页面的样式也已经返回到浏览器中了&#xff0c;下次切换页面时&#xff…

HTML 网页静态托管 API 接口文档(可集成到智能体Agent)

HTML 网页静态托管 API 接口文档&#xff08;可集成到智能体Agent&#xff09; 接口概述 本接口用于将HTML代码转换为可访问的网页&#xff0c;支持通过API密钥进行身份验证。 API 密钥申请地址&#xff1a; https://www.cuobiezi.net/user/api_keys/apply API接口信息 接…

springboot vue sse消息推送,封装系统公共消息推送前后端方法

概述 1、封装springboot全局的消息推送接口&#xff1b; 注&#xff1a;1&#xff09;由于原生HTML5 EventSource 不支持添加header&#xff0c;所以要把连接创建接口加入身份验证白名单&#xff0c;并在接口内添加自己校验token2&#xff09;后台需定时心跳&#xff0c;保证链…

LeetCode 每日一题 2025/9/1-2025/9/7

记录了初步解题思路 以及本地实现代码&#xff1b;并不一定为最优 也希望大家能一起探讨 一起进步 目录9/1 1792. 最大平均通过率9/2 3025. 人员站位的方案数 I9/3 3027. 人员站位的方案数 II9/4 3516. 找到最近的人9/5 2749. 得到整数零需要执行的最少操作数9/6 3495. 使数组元…

小迪安全v2023学习笔记(八十讲)—— 中间件安全WPS分析WeblogicJenkinsJettyCVE

文章目录前记服务攻防——第八十天中间件安全&HW2023-WPS分析&Weblogic&Jetty&Jenkins&CVE应用WPS - HW2023-RCE&复现&上线CS介绍漏洞复现中间件 - Weblogic-CVE&反序列化&RCE介绍利用中间件 - Jenkins-CVE&RCE执行介绍漏洞复现CVE-20…

各webshell管理工具流量分析

哥斯拉哥斯拉是一个基于流量、HTTP全加密的webshell管理工具 特点 1.内置了3种Payload以及6种加密器&#xff0c;6种支持脚本后缀&#xff0c;20个内置插件 2.基于java&#xff0c;可以跨平台使用 3.可以自己生成webshell&#xff0c;根据管理来生成一些payload&#xff0c;然后…

pytest(1):fixture从入门到精通

pytest&#xff08;1&#xff09;&#xff1a;fixture从入门到精通前言1. Fixture 是什么&#xff1f;为什么我们需要它&#xff1f;2. 快速上手&#xff1a;第一个 Fixture 与基本用法3. 作用域 (Scope)&#xff1a;控制 Fixture 的生命周期4. 资源管理&#xff1a;Setup/Tear…

Java17 LTS 新特性用例

基于 Java 17 LTS 的 实用示例 以下是基于 Java 17 LTS 的 30 个实用示例,涵盖语言新特性、API 改进及常见场景。所有代码均兼容 Java 17 语法规范。 文本块(Text Blocks) String json = """{"name": "Java 17","type": &qu…

SpringBoot-Web开发-内容协商——多端内容适配内容协商原理HttpMessageConverter

其它篇章&#xff1a; 一&#xff1a;SpringBoot3-日志——日志原理&日志格式&日志级别&日志分组&文件输出&文件归档&滚动切割 二&#xff1a;SpringBoot3-Web开发-静态资源——WebMvcAutoConfiguration原理&资源映射&资源缓存&欢迎页&…

Spring MVC 类型转换与参数绑定:从架构到实战

在 Spring MVC 开发中&#xff0c;“前端请求数据” 与 “后端 Java 对象” 的格式差异是高频痛点 —— 比如前端传的String类型日期&#xff08;2025-09-08&#xff09;要转成后端的LocalDate&#xff0c;或者字符串male要转成GenderEnum.MALE枚举。Spring 并非通过零散工具解…

Spark提交任务的资源配置和优化

Spark 提交任务时主要可调的资源配置参数包括 Driver 资源&#xff08;内存、CPU&#xff09;、Executor 资源&#xff08;数量、内存、CPU&#xff09;以及 集群管理相关参数。配置和优化时一般结合集群硬件资源、数据规模、作业类型和作业复杂度&#xff08;SQL / 机器学习&a…

机器学习06——支持向量机(SVM核心思想与求解、核函数、软间隔与正则化、支持向量回归、核方法)

上一章&#xff1a;机器学习05——多分类学习与类别不平衡 下一章&#xff1a;机器学习07——贝叶斯分类器 机器学习实战项目&#xff1a;【从 0 到 1 落地】机器学习实操项目目录&#xff1a;覆盖入门到进阶&#xff0c;大学生就业 / 竞赛必备 文章目录一、间隔与支持向量&…

AI集群全链路监控:从GPU微架构指标到业务Metric关联

点击 “AladdinEdu&#xff0c;同学们用得起的【H卡】算力平台”&#xff0c;H卡级别算力&#xff0c;80G大显存&#xff0c;按量计费&#xff0c;灵活弹性&#xff0c;顶级配置&#xff0c;学生更享专属优惠。 引言&#xff1a;AI算力时代的监控挑战 随着深度学习模型规模的指…

K8s Ingress Annotations参数使用指南

Kubernetes Ingress Annotations 是与特定 Ingress 控制器&#xff08;如 Nginx、Traefik、HAProxy 等&#xff09;配合使用&#xff0c;用于扩展和定制 Ingress 资源行为的关键配置项。它们通常以键值对的形式添加在 Ingress 资源的 metadata部分。Ingress Annotations参数速查…

CodeBuddy Code深度实战:从零构建智能电商推荐系统的完整开发历程

项目背景与挑战作为一名有着多年全栈开发经验的技术人员&#xff0c;我最近接手了一个具有挑战性的项目&#xff1a;为某中型服装电商平台开发一套智能商品推荐系统。该系统需要在2个月内完成&#xff0c;包含以下核心功能&#xff1a;前端&#xff1a;React TypeScript构建的…

Day 19: 算法基础与面试理论精通 - 从思想理解到策略掌握的完整体系

Day 19: 算法基础与面试理论精通 - 从思想理解到策略掌握的完整体系 🎯 课程概述 核心目标:深度理解算法设计思想和核心原理,掌握面试高频算法概念,建立完整的算法知识体系 学习重点: ✅ 核心数据结构的本质理解和应用场景分析 ✅ 经典算法设计模式的思想精髓和解题策…

AI与AR融合:重塑石化与能源巡检的未来

在石化企业和新能源电站的巡检工作中&#xff0c;传统模式正被一场技术革命所颠覆。AI与AR&#xff08; www.teamhelper.cn &#xff09;的深度融合&#xff0c;不仅提升了巡检效率&#xff0c;更将巡检工作从被动响应转变为预测预防&#xff0c;开启了智能运维的新篇章。一、透…