一、线性回归:从房价预测看懂 “连续值预测” 逻辑
线性回归是深度学习的 “敲门砖”,它的核心思想是用线性关系拟合数据规律,解决连续值预测问题—— 比如根据房屋特征估算房价、根据温度湿度预测降雨量等。
1. 从生活案例到数学模型
拿房价预测场景来说:看中一套房时,我们会收集它的特征(比如 7 间卧室、2 个车库、花岗岩 countertops 等),再参考往年同类房屋的成交价,最终估算出合理出价。这个过程本质就是线性回归的核心逻辑。

线性回归的数学模型可表示为y = wᵀx + b。其中,x 是输入特征向量(如卧室数、车库面积等房屋属性);w 是权重向量,代表每个特征对预测结果的 “影响力”(比如卧室数权重高,说明卧室多对房价提升更明显);b 是偏置项,相当于线性关系的 “截距”,捕捉特征之外的基础影响;y 则是预测的连续值(比如房价)。若处理批量数据,还可写成矩阵形式y = Xw + b,其中 X 是包含多个样本的特征矩阵,更适合计算机高效计算。
2. 线性回归的神经网络视角
线性回归其实是最简单的单层神经网络:输入层对应特征 x(如卧室数、车库大小),每个特征是一个输入神经元;输出层对应预测值 y(如房价),只有 1 个输出神经元;输入层与输出层是 “全连接”—— 每个输入特征都通过权重 w 与输出神经元相连,再叠加偏置 b 得到结果。
3. 如何训练:从损失到优化
模型的 “学习过程”,本质是找到最优的 w 和 b,让预测值 y 尽可能接近真实值。这需要损失函数与优化算法两个核心工具。
(1)损失函数:量化 “预测误差”
线性回归常用平方损失(L2 损失),计算预测值与真实值的平方差,损失越小,模型预测越准。
(2)优化算法:寻找 “最优参数”
最经典的方法是梯度下降法,核心逻辑是 “跟着梯度反方向走,最快找到最小值”。梯度是由所有参数(w 和 b)的偏导数组成的向量,指向 “损失函数增加最快的方向”;每次沿梯度的反方向更新参数,逐步降低损失。

实际中更常用小批量随机梯度下降(Mini-batch SGD) :随机梯度下降(SGD)每次用 1 个样本更新参数,速度快但波动大;小批量 SGD 每次用一小批样本(比如 32 个、64 个)计算梯度,兼顾效率与稳定性。
(3)关键超参数:学习率与批量大小
学习率(η)是参数更新的 “步长”,太大容易越过最小值,太小则训练太慢;批量大小需适中,太小浪费计算资源,太大则梯度估计不准,需根据硬件调整。
二、Softmax 回归:从 “连续预测” 到 “多类分类”
当任务从 “预测房价” 变成 “识别手写数字是 0-9 中的哪一个” 时,线性回归就不够用了 —— 这需要解决离散分类问题,而 Softmax 回归正是为此设计的多类分类模型。
1. 回归与分类:核心差异
回归的输出是连续数值,典型场景如房价预测、温度预测;分类的输出是离散类别,典型场景如手写数字识别、ImageNet 自然对象分类(1000 类)、Kaggle 蛋白质图像分类(28 类)、恶语评论分类(7 类)等。
2. Softmax 回归的模型设计
Softmax 回归在 linear 层基础上增加了 “概率转换”,核心是解决 “多类置信度” 问题。
(1)模型结构:全连接 + 多输出
Softmax 回归也是单层全连接神经网络,但输出层神经元数量等于类别数。输入层对应样本特征(比如图像的像素值),输出层每个神经元输出对应类别的 “原始置信度”。比如 MNIST 手写数字识别(10 类),输出层就有 10 个神经元,分别对应数字 0-9 的置信度。
(2)Softmax 运算:把置信度变成概率
原始置信度可能为负、总和不为 1,无法直接作为概率。Softmax 运算通过两步解决:用指数函数 exp (oᵢ) 把置信度转为 “非负值”,再除以所有类别的 exp 之和,得到 “和为 1 的概率分布”。例如,原始置信度 [1, -1, 2] 经 Softmax 运算后得到 [0.26, 0.04, 0.7],即预测为第 3 类的概率最高(70%)。
3. 损失函数:交叉熵更适合分类
线性回归的平方损失不适合分类任务 —— 当模型对错误类别置信度很高时,平方损失的梯度会很 小,导致学习缓慢。此时需用交叉熵损失,专门衡量两个概率分布的差异。它以真实标签的概率分布(如 “真实是第 2 类” 则为 [0,1,0] 的独热编码)和模型预测的概率分布为输入,模型预测越偏离真实标签,损失越大,梯度也越大,能快速 “惩罚” 错误预测。
三、总结:两个基础模型的核心脉络
线性回归与 Softmax 回归共享深度学习的核心逻辑 ——“特征输入→线性变换→损失量化→梯度优化”,但二者针对不同任务存在关键差异。

线性回归聚焦于回归任务,输出连续值,输出层只有 1 个神经元,核心运算为线性变换(wᵀx+b),常用平方损失函数;Softmax 回归针对多类分类任务,输出离散类别对应的概率分布,输出层神经元数量等于类别数,核心运算为 “线性变换 + Softmax”,常用交叉熵损失函数。二者在优化算法上均以小批量 SGD 为主流选择。

这两个模型是深度学习的 “地基”:后续的多层神经网络,本质是在它们的基础上叠加更多线性层与激活函数;而复杂的图像、NLP 任务,也都是从 “线性拟合” 或 “概率分类” 的逻辑延伸而来。吃透这两个模型,才算真正迈入深度学习的大门~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/100474.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/100474.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/100474.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-5-Codex CLI保姆级教程:获取API Key配置与openai codex安装详解

朋友们,就在 2025 年 9 月中旬,OpenAI 悄悄扔下了一颗重磅炸弹:GPT-5-Codex。 如果你以为这只是又一次平平无奇的模型升级,那可就大错特错了。 我可以这么说:软件开发的游戏规则,从这一刻起,可能…

基于Spark的用户实时分析

Spark的最简安装 1. 下载并解压 Spark 首先,我们需要下载 Spark 安装包。您可以选择以下方式之一: 方式一:从官网下载(推荐) # 在 hadoop01 节点上执行 cd /home/hadoop/app wget https://archive.apache.org/dist/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz方…

OpenCV 风格迁移、DNN模块 案例解析及实现

图像风格迁移是计算机视觉领域极具趣味性的技术之一 —— 它能将普通照片(内容图像)与艺术画作(风格图像)的特征融合,生成兼具 “内容轮廓” 与 “艺术风格” 的新图像。OpenCV 的 DNN(深度神经网络&#x…

MySQL 日志:undo log、redo log、binlog以及MVCC的介绍

一、MySQL 日志:undo log、redo log、binlogundo log(回滚日志):是 Innodb 存储引擎层生成的日志,实现了事务中的原子性,主要用于事务回滚和 MVCC(隔离性)。 redo log(重…

【面板数据】省及地级市农业新质生产力数据集(2002-2025年)

农业新质生产力是以科技创新为核心驱动力,以科技化、数字化、网络化和智能化为主线,通过技术革命性突破、生产要素创新性配置、产业深度转型升级,实现农业全要素生产率显著跃升的先进生产力形态 本数据基于2002-2025年各省政府工作报告中关于…

20250917在荣品RD-RK3588-MID开发板的Android13系统下使用tinyplay播放wav格式的音频

input keyevent 24 1|console:/sdcard # cat /proc/asound/cards console:/sdcard # ls -l /dev/snd/【需要打开Android13内置的音乐应用才会有声音出来,原因未知!】 1|console:/sdcard # tinyplay /sdcard/Music/kiss8.wav -D 1 -d 020250917在荣品RD-R…

总共分为几种IP

IP(Internet Protocol)地址根据不同的分类标准可分为多种类型,以下是常见的分类方式:按版本分类IPv4:32位地址,格式为四组十进制数字(如192.168.1.1),约43亿个地址&#…

【Linux】常用命令(六)

【Linux】常用命令(六)1. yum命令1.1 基本语法1.2 常用命令2. 从服务器把数据cp到本地3. uname命令3.1 常用命令1. yum命令 全称:Yellowdog Updater, Modified作用:是 RPM 包管理器的前端工具,用于基于 RPM 的 Linux …

go grpc开发使用

1、安装proto 下载 Windows 版本 打开官方发布页面 访问 Protocol Buffers 的 GitHub Releases 页面: 👉 https://github.com/protocolbuffers/protobuf/releases 解压 ZIP 文件 将下载的 ZIP 文件解压到一个你容易找到的目录,例如&#xff1…

MyBatis分页:PageHelper

MyBatis分页:PageHelper 📖 前言:为什么需要分页? 在处理大量数据时,一次性从数据库查询并返回所有结果是不可行的,这会带来巨大的性能和内存开销。分页是解决这一问题的标准方案。而PageHelper是一个极其流…

Gin框架:构建高性能Go Web应用

Gin框架:构建高性能Go Web应用 Gin是Go语言中最受欢迎的Web框架之一,以其高性能、简洁API和丰富的中间件支持而闻名。本文将带你从零开始,逐步掌握Gin框架的核心概念和高级特性,并通过实际代码示例演示如何构建高效的Web应用程序。…

IO进程——线程、IO模型

一、线程Thread1、引入1.1 概念相当于是一个轻量级的进程,为了提高系统的性能引入线程,在同一进程中可以创建多个线程,共享进程资源1.2 进程和线程比较相同点:都为操作系统提供了并发执行的能力不同点:调度和资源&…

人工智能概念:NLP任务的评估指标(BLEU、ROUGE、PPL、BERTScore、RAGAS)

文章目录一、评估指标基础1. 准确率(Accuracy)2. 精确率(Precision)3. 召回率(Recall)4. F1-Score5. 示例二、文本生成专用指标1. BLEU:机器翻译与标准化文案的“质量标尺”1.1 计算流程&#x…

团队对 DevOps 理解不统一会带来哪些问题

团队对DevOps理念与实践的理解不统一、片面甚至扭曲,是导致众多企业DevOps转型失败的根本原因,它将直接引发一系列深层次的、相互关联的严重问题。核心体现在:转型极易沦为“为了工具而工具”的盲目自动化,导致最核心的文化变革被…

企业级实战:构建基于Qt、C++与YOLOv8的模块化工业视觉检测系统(基于QWidget)

目录一、概述二、项目目标与技术架构2.1 核心目标2.2 技术选型2.3 软件架构三、AI推理DLL的开发 (Visual Studio 2019)3.1 定义DLL接口 (DetectorAPI.h)3.2 实现核心功能 (DetectorAPI.cpp)四、Qt Widget GUI应用程序的开发4.1 项目配置 (.pro 文件)4.2 UI设计 (mainwindow.ui)…

SVN自动化部署工具 脚本

SVN自动化部署工具 功能概述 这是一个自动化部署SVN仓库的bash脚本,主要功能包括: 自动安装SVN服务(如未安装) 创建SVN项目仓库 配置多用户权限 设置自动同步到网站目录 提供初始检出功能 下载地址 https://url07.ctfile…

Facebook主页变现功能被封?跨境玩家该如何申诉和预防

不少跨境玩家在运营Facebook公共主页时,最期待的就是通过变现工具获得稳定收入。但现实中,经常会遇到一个扎心的问题:主页好不容易做起来,却突然收到提示——“你的变现功能已被停用”。这意味着收入中断,甚至可能导致…

安装es、kibana、logstash

下载 elk 下载地址 elasticsearch地址: https://www.elastic.co/cn/downloads/elasticsearch kibana地址: https://www.elastic.co/cn/downloads/kibana logstash地址: https://www.elastic.co/cn/downloads/logstash 解压elk 创建es全家桶文件夹 cd /usr/local mkdir elk …

Django admin 后台开发案例【字段/图片】

这是一个简单的django admin 管理后台,这个应用案例主要是给运营人员进行填写数据 主要功能包括: 上传图片功能【选择上传时可以预览】【替换已有数据中的图片时可以预览新旧图片】 每条数据都将会记录操作历史。记录操作人是谁?修改内容是什么?并且定位责任到某一员。 …

【C++】const和static的用法

目录🚀前言💻const:“只读”的守护者💯修饰普通变量💯修饰指针💯修饰函数💯修饰类成员💯修饰对象🌟static:“静态存储”与“作用域控制”💯修饰全…