pingmian/2025/6/30 19:52:47/文章来源:https://blog.csdn.net/dj1955/article/details/148909729

损失函数 与平均方差函数傻傻分不清

损失函数是概念；平均方差函数是具体的实现

损失函数（如均方误差 MSE）用于衡量模型预测值与真实值之间的差距。损失越小，说明模型对当前数据的拟合越好。

但模型并非拟合度越高越好，假设模型输入它没见过的数据，模型预测的结果跟实际出入很大，不符合要求，这种现象叫过拟合；如果模型对新数据也有很好的预测效果，就是泛化能力强

后续。。。

对于直线模型很简单，但是世界事物的规律是很复杂的不能通过直线模型来表达，更多是弯弯曲曲的曲线，要描述这样曲线是通过非线性函数 (激活函数) 嵌套线性函数，一层嵌套还是不能描述出这样复杂曲线，就需要n多层的这样嵌套函数，理论上能造出非常复杂的曲线（很抽象很难理解）

激活函数：

梯度下降：

w = w - 学习率 × ∂L/∂w

卧槽！这个公式是什么意思？其实 ∂L/∂w 是梯度，还是不懂，什么是梯度？回到二维平面，这个梯度等同与初中数学的斜率。这里抛物线描述的是直线模型的损失函数在变量w 方向上变化。机器通过不断调整w值让损失函数最小，什么时候最小? 答：顶点最小，顶点怎么求？有顶点公式，也可以使用导数 = 0 求出。

但是复杂模型的损失函数不是一条简单的抛物线，于是就有梯度下降算法，本质上是不断猜和试，但是不能盲猜，面多加水，水多加面，水和面不能一下加太多，就使用小勺子（学习率）慢慢调

如下图

当切点在右边是正数，就减去一点点；当切点在左边是负数数，负负得正加一点点。就这样一点点不断地试，总有w是某个值，让损失函数最小。

而 ∂L/∂w是高纬度的曲面的表面曲线求导，这里方便人的理解，高维我这里通常指3维，4维我们想象不出来！

下图是一座大山，是3维立体的，红线就是曲面上的某条曲线，像不像一个个阶梯，∂L/∂w 就好比下山某条曲线的陡峭程度，如果∂L/∂w的绝对值（包含正负数）越大说明越陡峭！∂L/∂w如果是正数右倾斜，如果是负数表示左倾斜

∂L/∂w 那是多少怎么算？这里是使用链式法则（不展开讲，高数不过关，但这不影响我们理解，机器会就行）

总结一下：

W新 = W当前 - 学习率 × ∂L/∂w

这个是公式指导机器如何自己调整W值，当W猜测是3时，预测值与真实值误差大了，∂L/∂w就变大，那我猜测新的W 值，就需要减少一点∂L/∂w。∂L/∂w有时很大，就需要使用学习率进行缩放。回到下山例子就是，人下山既要快，就需要选择最陡峭的路线，但是不安全，就需要使用学习率控制，要快也要安全。

反向传播：在神经网络从后往前，使用损失函数指导修改预测函数参数的过程，就是反向传播

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/86794.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/86794.shtml
英文地址，请注明出处：http://en.pswp.cn/pingmian/86794.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

安全生产风险管控平台：企业安全管理的智能化解决方案

在工业生产、建筑施工、能源化工等领域，安全生产是企业可持续发展的基石。然而，传统安全管理模式依赖人工巡检、纸质记录和事后处理，难以满足现代化企业的高效风险管控需求。安全生产风险管控平台应运而生，它利用物联网、大数据、…

阅读更多...

如何保证数据库与 Redis 缓存的一致性?

在现代互联网应用中，Redis 缓存几乎是性能优化的标配。但在使用过程中，一个绕不过去的问题就是： 如何保证 Redis 缓存与数据库之间的数据一致性？ 特别是在高并发场景下，读写操作错位可能导致缓存中出现脏数据&#xff…

阅读更多...

现代 JavaScript (ES6+) 入门到实战（三）：字符串与对象的魔法升级—模板字符串/结构赋值/展开运算符

现代 JavaScript (ES6+) 入门到实战（三）：字符串与对象的魔法升级—模板字符串/结构赋值/展开运算符

在前两篇，我们升级了变量和函数。今天，我们要给 JavaScript 中最常用的两种数据类型——字符串（String）和对象（Object）——装备上 ES6 带来的强大魔法。准备好告别丑陋的号拼接和重复的对象属性赋值了吗…

阅读更多...

GitLab 备份恢复与配置迁移详尽教程（实战版）

🛠 GitLab 备份恢复与配置迁移详尽教程（实战版） 🧱 一、环境准备 1.1 检查版本一致性恢复目标机 GitLab 版本必须与备份文件所用版本一致或兼容（推荐相同版本） 查看当前 GitLab 版本： sudo g…

阅读更多...

英飞凌高性能BMS解决方案助力汽车电动化

随着电动汽车越来越被大众接受，车辆电气化、智能化程度越来越高，如何提高电动汽车的续航里程，同时保障车辆安全可靠持久运行是当前最主要的技术难题之一。而先进的电池管理系统 (BMS)有助于克服电动汽车广泛普及的关键障碍：续航里…

阅读更多...

react + ant-design实现数字对比动画效果：当新获取的数字比之前展示的数字多或少2时，显示“+2”或“-2”的动画效果

react + ant-design实现数字对比动画效果：当新获取的数字比之前展示的数字多或少2时，显示“+2”或“-2”的动画效果

react ant-design实现数字对比动画效果：当新获取的数字比之前展示的数字多或少2时，显示“2”或“-2”的动画效果 1. 创建独立的 AnimatedValue 组件 // components/AnimatedValue/index.jsx import React, { useState, useEffect, useRef } from reac…

阅读更多...

自动化测试--Appium和ADB及常用指令

1.Appium Appium工具库： appium server：服务器（类似于浏览器的驱动），核心进行客户端命令的接受，完成设备的自动化指令 appium client：客户端，让代码进行调用，发送自动化的…

阅读更多...

2025.6.29总结

有一点我很好奇，工作后，我该拿什么去衡量自己的进步呢？ 在我的大学四年，确实有个量化的标准，读了多少本书，写了多少篇总结，多少篇技术博客，多少行代码，运动了多少公里&a…

阅读更多...

Docker 部署 Kong云原生API网关

Docker 部署 Kong云原生API网关本指南提供了在 Docker Compose 上配置 Kong Gateway 的步骤，基于有数据库模式的配置。本指南中使用的数据库是 PostgreSQL。前置条件准备一台Ubuntu服务器： 节点IP: 192.168.73.11操作系统： Ubuntu 24…

阅读更多...

深度剖析 Apache Pulsar：架构、优势与选型指南

Apache Pulsar 是一款云原生分布式消息流平台，融合了消息队列、流处理和存储能力，采用独特的“存储计算分离”架构（Broker 无状态 BookKeeper 持久化存储）。以下从核心特性、对比优势及适用场景展开分析： 一、Pulsar…

阅读更多...

java 导出word 实现循环表格

如果是固定的值用 {{}} 即可但是如果是循环表格，那么就需要制定模板为如图然后在处理表格数据时候： /*** 传入节点对象返回生成的word文档* param flangeJoint* return* throws IOException*/private XWPFTemplate getXwpfTemplate(CmComplaintEn…

阅读更多...

XIP (eXecute In Place)

NOR Flash 能直接执行代码（XIP）而 NAND Flash 不能，根本原因在于它们的物理结构和访问接口存在本质区别。下面用技术原理 + 现实比喻帮你彻底理解： 1. XIP 是什么？ XIP (eXecute In Place) 指代码不需要从存储介质复制到 RAM，而是 CPU 直接从存储介质（如 Flash）中读取…

阅读更多...

【android bluetooth 协议分析 10】【AVRCP详解1】【PlaybackStateCompat类如何查看】

【android bluetooth 协议分析 10】【AVRCP详解1】【PlaybackStateCompat类如何查看】

1. 问题 android/app/src/com/android/bluetooth/avrcpcontroller/AvrcpControllerService.java import android.support.v4.media.MediaBrowserCompat.MediaItem; import android.support.v4.media.session.PlaybackStateCompat;private int toPlaybackStateFromJni(int fro…

阅读更多...

【AI学习从零至壹】LLM模型prompt开发及⼤模型应⽤

LLM模型prompt开发及⼤模型应⽤⼤语⾔模型 LLM如何构建⼀个AI对话系统关于模型的训练 ollama调⽤LLM模型设置API KEY测试一个对话 prompt提示词提示词结构特征提示词的五大核心价值1. 信息传递的精准性2. 输出质量的可控性3. 用户意图的对⻬性4. 复杂任务的拆解性5. 伦理⻛险的…

阅读更多...

ubuntu20.04如何给appImage创建快捷方式

ubuntu20.04如何给appImage创建快捷方式 1. 确保AppImage是可执行的 chmod x /path/to/your/appimage2. 创建.desktop文件在~/.local/share/applications/目录下创建一个新的 .desktop 文件： vi ~/.local/share/applications/your-appname.desktop添加以下内容…

阅读更多...

RT-Thread 详解：国产开源实时操作系统

一、RT-Thread 概述定义：RT-Thread 是中国自主研发的开源实时操作系统（RTOS），兼具实时性与物联网（IoT）特性，支持从资源受限的 MCU（如 STM32、ESP32）到高性能处理器&…

阅读更多...

Wan2 1-VACE

简介 VACE是阿里新开源的视频编辑/生成框架，号称能够执行任意的视频编辑/生成。总体而言，该模型在整体结构上并没有太大改变，仅仅是在原Wan2.1模型的基础上，加了一个接受mask和视频输入的controlnet而已。但是这篇文章认为&#…

阅读更多...

基于 opencv+yolov8+easyocr的车牌追踪识别

（本项目所有代码打包至我的资源中，大家可在我的文章底部选择下载） 目录需求实现效果学习视频大致思路代码实现资源下载需求通过车辆识别技术，识别视频中每个车辆及其车牌号，车辆应进行追踪，避免重复…

阅读更多...

sqlserver函数与过程（二）

过程 SQLserver 过程是具有特定功能，可多次对数据表操作的独立模块。返回值通常用return 返回整数 0，1…。(可选）也可通过output 参数或select 语句返回结果集。 1.过程的定义本过程定义了一个过程，输入一个动态SQL语句&#…

阅读更多...

OpenCV学习3

1、创建图像窗口滑动条 OpenCV 4中通过createTrackbar()函数在显示图像的窗口上创建滑动条。 int cv::createTrackbar(const String &trackbarname,const String &winname, int *value, int count, TrackbarCallback onChange 0, void *us…

阅读更多...

最新文章