Class3Softmax回归

在这里插入图片描述
回归VS分类

回归是估计一个连续值

分类是预测一个离散类别

回归分类
单连续值输出通常为多个输出
自然区间R输出i是预测为第i类的置信度
跟真实值的区别作为损失

生活中的分类问题

1.垃圾分类

类别
可回收物
湿垃圾(厨余垃圾)
干垃圾
有害垃圾

2.邮件分类

类别:
正常邮件
垃圾邮件(广告、钓鱼)

从回归到多类分类

均方损失

在这里插入图片描述
判断当前元素为该类,设置为1,其余类别归为0
在这里插入图片描述

无校验比例

在这里插入图片描述

在这里插入图片描述
为什么需要校验?
因为Softmax 的输出不是总是可靠的概率,原因是模型可能过于自信或不够自信

举例:
模型预测某图像为 “猫” 的概率为 0.95,但是实际上模型只有 70% 的概率是正确的。这种情况下:

无校验比例是 0.95(原始 softmax 输出)

校验比例是 0.70(经过校准的真实置信度)

常见的配置为:

训练比例:80%
校验比例:20%

Softmax
Softmax 是一个常用在 分类模型输出层 的函数,主要作用是将一组实数转换为概率分布,即每个输出值都是 0 到 1 之间的数,并且所有输出加起来等于 1。

公式:
给定一个向量
𝑧=[𝑧1,𝑧2,…,𝑧𝑛],softmax输出 𝜎(𝑧)𝑖为:
在这里插入图片描述

对每个元素求指数𝑒𝑧𝑖

然后除以所有指数的总和

得到的是每个类别的“相对概率”

Softmax 的作用:
归一化:输出变成概率分布(所有值相加等于 1)。

区分强弱:大值被放大,小值被压缩,更容易做出决策。

适合分类任务:常用于神经网络多分类的最后一层。
在这里插入图片描述
左图是模型的原始输出(logits),右图是通过 softmax 转换后的概率分布。可以看到:

logits 数值差距不大,但 softmax 后的概率差距被放大。

最大的 logits(Class A)对应最高的概率(约 65%)。

所有概率加起来正好是 1,适合用于多分类预测。

交叉熵损失
交叉熵常用来衡量两个概率分布的区别。

公式:
在这里插入图片描述

𝑝:真实的概率分布(比如 one-hot 标签)

𝑞:模型预测的概率分布(经过 softmax 得到)

理解:

如果预测𝑞越接近真实标签𝑝,那么交叉熵越小(越好)

如果预测错了,尤其是把正确类的概率预测得很低,损失会很大(因为 log 变负很快)

本质上,交叉熵就是衡量预测概率分布与真实 one-hot 分布的差距

梯度推导公式

在这里插入图片描述
这是 softmax + cross entropy 的梯度

含义:

损失函数对第 𝑖个输出的梯度 = 预测概率 - 真实值

它使得训练过程的反向传播特别高效(简洁且数值稳定)

常被称作 “softmax with log loss” 的“简化公式”

总结
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86762.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86762.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/86762.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day042-负载均衡与web集群搭建

文章目录 0. 老男孩思想-面试官问:你对加班的看法?1. 负载均衡2. 搭建负载均衡的WordPress集群2.1 负载均衡服务器2.2 配置web服务器2.3 测试 踩坑记录1. /var/cache/nginx权限问题 0. 老男孩思想-面试官问:你对加班的看法? 互联网公司没有不加班的&a…

40岁技术人用AI寻找突破路线

年近40,坐标重庆,从事医疗器械行业多年,遇到发展瓶颈。刚好遇到AI技术浪潮。最近一年在不断尝试把AI应用于工作生活的方方面面。 总结一下我是如何利用AI来做职业规划的: 整理好自己的简历,越详细越好。这个可以利用…

kde截图工具报错

An error occurred while taking a screenshot. KWin screenshot request failed: The process is not authorized to take a screenshot Potentially relevant information: - Method: CaptureScreen - Method specific arguments: "eDP-2"好的,感谢您提…

有理函数积分——分式分解时设分解式的规则

目录 一、设前处理 1. 假式化真式 2. 分母因式分解 3. 判断可约不可约 二、一次分母 1. 多项一次分母​ 2. 单项一次重复分母​ 三、二次分母(当然是分母不可约的,如果可约就因式分解然后对应一次分母) 1. 多项二次分母​ 2. 单项二次重复分母​ 四、混…

从 AJAX 到 axios:前端与服务器通信实战指南

直到现在我们小宁已经更新了44作品了,其中和大家介绍了Python入门基础、Fast API框架、SQLite数据库,以及前端的知识都已经学习完了,总的来说现在前端、后端、数据库已经都学习了,那大家是否有这样的疑问,前端后端到底…

Pycatia二次开发基础代码解析:面属性控制、视图定向与特征统计的工业级实现

本文将以专业视角深入解析CATIA二次开发中的三个核心类方法,通过详细分析代码实现揭示其在工业设计中的实际应用价值。全文将严格围绕提供的代码展开,不做任何修改或补充。 一、面属性控制:精确可视化表达技术 方法功能解析 color_and_laye…

bmc TrueSight 监控 Oracle 11g 配置

bmc TrueSight 监控 Oracle配置 文章目录 bmc TrueSight 监控 Oracle配置1.将pat加入oinstall和dba组2.创建监控的表空间和临时表空间并告知表空间名称3.将oracle相关系统环境变量加入到监控pat账户的.profile或.bash_profile文件4.登陆Apollo监控web页面,设置基础架…

css实现高度可变、上下边框是渐变色、左右边框是纯色的div容器

效果图&#xff1a; div容器&#xff1a; <div className{styles.container}><div className{styles.content}><div className{styles.inner}><!-- 内容部分 --></div></div> </div> css&#xff1a; .container {float: left;w…

python二维码识别

pyzbar 识别QR二维码 from PIL import Image from pyzbar.pyzbar import decode# 打开图像文件 image_path qr01.jpg # 替换为你的图像路径 image Image.open(image_path)# 解码图像中的二维码 decoded_objects decode(image)# 输出识别结果 for obj in decoded_objects:p…

ZYNQ EMMC/FLASH/SD卡深度性能评测与创新实践

深入探索ZYNQ存储子系统性能,揭示硬件加速下的存储优化之道 一、存储性能为何如此重要? 在基于Xilinx ZYNQ SoC的嵌入式系统中,EMMC、QSPI FLASH和SD卡作为核心存储介质,直接影响系统启动时间、数据吞吐量和用户体验。传统测试方法往往局限于简单读写速度测试,缺乏对真实…

html制作一个简单的表单

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><title>表单输入练习</title><style></style> </head><body style"background-color: pink;"><div><h2>…

差分对的等长等距

差分对的等长等距: 差分对中两个单端信号的延时差会导致接收端信号的错位&#xff0c;引起差分信号的畸变&#xff0c;同时会产生共模噪声导致接收端差分信号抖动增加。因此差分对设计的一个基本要求就是要尽量保持差分对两条单端线延时相等。 图8-27显示了差分对中两条单端线…

SQL 子查询全位置解析:可编写子查询的 7 大子句

&#x1f50d; SQL 子查询全位置解析&#xff1a;可编写子查询的 7 大子句 子查询可以出现在 SQL 语句的多个关键位置&#xff0c;不同位置的子查询具有独特的行为和限制。以下是系统化总结&#xff1a; &#x1f4cc; 1. WHERE 子句&#xff08;最常用&#xff09; SELECT 列…

C#高级:Winform桌面开发中DataGridView的详解(新)

一、数据填充&#xff08;反射&#xff09; 1.封装 /// <summary> /// 渲染DataGridView /// </summary> /// <param name"dataGridView">被渲染控件</param> /// <param name"list">数据集</param> /// <param …

人脸活体识别2:Pytorch实现人脸眨眼 张嘴 点头 摇头识别(含训练代码和数据集)

人脸活体识别2&#xff1a;Pytorch实现人脸眨眼 张嘴 点头 摇头识别(含训练代码和数据集) 目录 人脸活体识别2&#xff1a;Pytorch实现人脸眨眼 张嘴 点头 摇头识别(含训练代码和数据集) 1. 前言 2.人脸活体识别方法 &#xff08;1&#xff09;基于人脸动作的检测​​ &a…

Webpack 自定义插件开发指南:构建流程详解与实战开发全攻略

一. webpack打包流程 开发 Webpack 插件的第一步&#xff0c;就是明确&#xff1a;我的插件要接入 Webpack 构建流程的哪个阶段&#xff0c;解决什么问题。 了解流程之前首先要了解插件的两个核心概念&#xff1a;compiler&#xff0c;compilation 1. compiler&#xff1a;全局…

本地部署Dify+Ragflow及使用(一)

概念说明 RAGflow&#xff1a; 吃透知识&#xff1a;将企业文档&#xff08;如技术白皮书&#xff09;解析为结构化知识片段。精准检索&#xff1a;当用户提问时&#xff0c;从知识库中召回最相关内容。 模型供应商&#xff1a; 提供大脑&#xff1a;为 Dify 提供生成答案的模…

2025.06.24【R语言】|clusterProfiler安装与常见报错FAQ全解

文章目录 一、clusterProfiler安装方法1. Bioconductor官方推荐2. Conda安装&#xff08;个人推荐 适合服务器/依赖复杂环境&#xff09;3. 检查安装 二、常见依赖包安装三、常见报错与解决方案1. 报错&#xff1a;could not find function "bitr"2. 报错&#xff1a…

【转】PostgreSql的镜像地址

docker.io/postgres 项目中国可用镜像列表 | 高速可靠的 Docker 镜像资源 docker.io/postgrest/postgrest:v12.2.8 linux/amd64 docker.io17.34MB2025-04-04 13:14 346 docker.io/postgrest/postgrest:v12.2.12 linux/amd64 docker.io17.38MB2025-05-27 22:02 79 docker.io…

爬虫005----Selenium框架

在总结爬虫 &#x1f577; 框架之前&#xff0c;先总结一下selenium框架&#xff0c;也可以说是selenium库&#xff0c;在自动化测试中是老生常谈了&#xff08;长时间⌛️不用&#xff0c;已经忘记了&#xff0c;实际测试工作中做UI自动化的也很少了&#xff0c;上次搞UI自动化…