diannao/2025/6/29 2:01:41/文章来源:https://blog.csdn.net/2403_87029609/article/details/148948346

目录

基本思路

1.训练资料上loss很大

1.1 model bias

1.2 optimazation（优化不够好）

1.3如何确定是 model bias还是optimazation

解决方法

2.训练资料上loss很小

2.1 Overfitting

解决方案

1.使用更多训练资料

2.限制模型

2.2 Mismatch

3.选出最优模型

常见误区

测试集划分为public和private原因

解决方法：Cross-Validation（交叉验证）

N-fold Cross Validation

基本思路

最终结果不满意时（比如在Kaggle上得分低），按照以下思路改进

首先检查训练资料上的loss

1.训练资料上loss很大

1.1 model bias

可能是模型偏差导致的，解决方案：重新设计模型，增大模型的弹性，如增加feature

1.2 optimazation（优化不够好）

但不是所有情况都是model bias的问题。参数优化不够好也会引起问题。

1.3如何确定是 model bias还是optimazation

注意：上图所示不是Overfitting（指训练资料上loss小，而测试资料上loss大）！显然56层的模型弹性比20层的更大，所以是优化的问题。

解决方法

2.训练资料上loss很小

进一步检查测试资料上的loss，如果很小，恭喜你，已经训练成功了。下面是针对测试资料上loss很大的情况

2.1 Overfitting

模型弹性太大，可能出现这个问题，模型过度“记忆”了训练数据的细节（包括噪声和异常值），而非学习其内在规律。

解决方案

1.使用更多训练资料

此方法往往是最有效的。但有时不能找到更多的资料，此时可使用Data Augmentation（数据增强）利用有限样本生成更多资料，比如左右翻转图片、裁剪放大图片，但数据需符合真实场景：不分图片不能翻转

2.限制模型

使用更少的参数，使用弹性更小模型，如CNN（卷积神经网络）等等。

但是过犹不及，如果限制太大，又会回到model bias的问题。

2.2 Mismatch

训练资料和测试资料的数据有不同的分布，增加训练数据也无济于事。

3.选出最优模型

常见误区

选取public得分最高的作为结果上传

测试集划分为public和private原因

即使是一个很废物的模型，只要通过一直调参，不断上传，也可能在得到一个很好的结果。将测试集划分为public和private，只有public分数展示给提交者，最终以private的分数为准，可以避免上述情况。

这是因为很多testing set是全部公开的，没有划分public和private，所以通过不断调参，可以得到好的结果。但现实中往往机器并不能取得超过人类的结果。

解决方法：Cross-Validation（交叉验证）

从training set划出Validation set（验证集），后者不参与模型的调参，用模型在后者上的结果表示训练结果。最后选择模型时，选validation set上表现最好的，尽量不要在意public上的结果，如果又根据public上的结果反复调整，可能出现模型fit在public testing set这种上述提及的情况。

N-fold Cross Validation

如果划分的验证集数据不好，会影响最终结果，k-Fold Cross-Validation（k折交叉验证）可以解决此问题：每次用不同的数据作为验证集，直至覆盖所有数据，然后取平均值作为结果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/diannao/88841.shtml
繁体地址，请注明出处：http://hk.pswp.cn/diannao/88841.shtml
英文地址，请注明出处：http://en.pswp.cn/diannao/88841.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

使用ubuntu下的FAST和gfzrnx进行广播星历下载及版本之间的转换

使用FAST下载混合的广播星历文件 cd FAST_V3.00.03 (进入文件夹) chmod x FAST (授权) chmod x bin/* ./FAST1 下载：https://gnss.gfz.de/services/gfzrnx/download （需注册） 2 打开bash，依次输入 (其中gfzrnx_2.1.12_lx64为下载…

阅读更多...

vue裁剪图片

有一个需求就是在你有俩张图片一样大小，一个亮色的，一个暗色的，亮色的根据后端返回的数据显示多高，这样就有一个感觉是慢慢往上走的，主要用到了css的一个属性 .my-info-image {width: 280px;height: 200px;position: a…

阅读更多...

使用GDAL库统计不同分区内的灾害点分布情况，计算灾害相对密度等统计指标

主要功能是处理地理空间栅格数据（TIFF文件）和灾害点数据（CSV文件），统计不同分区内的灾害点分布情况，并计算灾害相对密度等统计指标。 TIFF文件：已经重分类后的文件 CSV文件：灾害点…

阅读更多...

jar 包如何下载

在 Javaweb - 2 中，我们导入了三那个 jar 包来进行服务端的 JSON 串格式转换，这个为大家做一个如何下载那三个 jar 包的教程~ 打开仓库网站我们需要先打开一个仓库网址：Maven Repository: Search/Browse/Explore 这个网址中，几…

阅读更多...

【vue3】打包配置webpack压缩，哈希值设置

压缩配置依赖下载： npm i --save-dev compression-webpack-plugin vue.config.js配置 const CompressionWebpackPlugin require(compression-webpack-plugin);filenameHashing: true, // 打包后为文件名增加hash值// 配置webpackconfigureWebpack: config >…

阅读更多...

vue3 + elementPlus 封装hook,检测form表单数据修改变更；示例用 script setup 语法使用

vue3 + elementPlus 封装hook,检测form表单数据修改变更；示例用 script setup 语法使用

vue3 elementPlus 封装hook,检测form表单数据修改变更；示例 script setup 语法原文：https://mp.weixin.qq.com/s/gCuqKskp-KBxdClxcpwFqw原文：https://mp.weixin.qq.com/s/gCuqKskp-KBxdClxcpwFqw原文：https://mp.weixin.qq.com…

阅读更多...

Java-泛型类

一、泛型类的基本概念 1. 什么是泛型类泛型类是指使用类型参数定义的类，可以在类定义时不指定具体类型，而在实例化时指定。 2. 泛型类的作用类型安全：编译时检查类型匹配消除强制转换：减少运行时ClassCastException风险代…

阅读更多...

信任边界的人生智慧

我曾经是个喜欢试探的人总想知道朋友会不会在我困难时伸手，合作伙伴会不会在利益面前变脸，爱人会不会在诱惑下坚守结果发现，每一次试探都像是在关系上撒盐不是因为对方经不起考验，而是「考验」这个行为本身就充满了不信任的…

阅读更多...

SQL Server 中 GO 的作用

CREATE DATABASE MyDatabase; USE MyDatabase; GO --定义局部变量 DECLARE s_no varchar(8), s_avgrade numeric(4,1); --对局部变量赋值 SET s_no 20170208; SET s_avgrade 95.0; --使用局部变量 UPDATE student SET s_avgrade s_avgrade WHERE s_no s_no;🌟 G…

阅读更多...

指标中台+大模型：解密衡石Agentic BI的NL2DSL架构实现

——Text2Metrics引擎如何攻克语义鸿沟，碾压传统NL2SQL方案一、传统NL2SQL的“架构原罪”：业务语义的失控黑洞当某银行尝试用NL2SQL分析“高净值客户流失率”时，系统生成如下危险SQL： 这正是NL2SQL的三大架构缺陷：…

阅读更多...

设计模式 - 抽象工厂

抽象工厂是对工厂的抽象化，而不只是制造方法。为了满足不同用户对产品的多样化需求，工厂不会只局限于生产一类产品，但是系统如果按工厂方法那样为每种产品都增加一个工厂又会造成工厂泛滥。所以，为了调和这种矛盾，抽…

阅读更多...

面向对象Plus（2/2）

目录面向对象Plus(qianwen) 一.面向对象三大特性封装继承多态二.多态 1.了解多态 2.体验多态三.类属性和实例属性 1.类属性 a.设置和访问类属性类属性的优点 b.修改类属性四.类方法和静态方法 1.类方法 a.类方法特点 b.类方法应用场景 2.静态方法 a…

阅读更多...

MocapApi 中文文档和github下载地址 NeuronDataReader（以下简称 NDR）的下一代编程接口

MocapApi 中文文档和github下载地址 NeuronDataReader（以下简称 NDR）的下一代编程接口

以下是 MocapApi 技术文档 github https://github.com/pnmocap/MocapApi?tabreadme-ov-file 国内可以查找getcode 英文文档 https://mocap-api.noitom.com/mocap_api_en.html 概述 MocapApi 是 NeuronDataReader（以下简称 NDR）的下一代编程接口&…

阅读更多...

STM32历史、命名、Flash、工作频率

目录命名: Flash: 工作频率： 复位： 低功耗模式： IO端口： JATG: 看门狗定时器： STM是一家半导体公式，专门做芯片的，STM32是指32位的微处理器，其中芯片的架构是ARM结构的&#…

阅读更多...

了解公共部门中的数据网格：支柱、架构和示例

作者：来自 Elastic Elastic Platform Team 想想那些像公共健康记录、城市规划模型等项目背后的所有数据。政府机构一直在产生大量数据。当数据分散在云平台、本地系统或像卫星和应急响应中心这样的专业环境中时，情况变得更加复杂。找到信息变得困难&…

阅读更多...

阿里云ACP-检索分析服务

当数据量爆炸增长，并且需要提供全文检索功能，需要有效的数据检索能力用什么数据库怎么保证安全性如何解决统计分析问题如何解决单点故障如何解决检索难题应对方案： 关系型数据库：主从备份解决数据安全性问题，数据…

阅读更多...

【DBeaver】跨平台数据库连接工具DBeaver Community 23.2.5安装配置使用

【DBeaver】跨平台数据库连接工具DBeaver Community 23.2.5安装配置使用

DBeaver是一款免费开源的通用数据库管理工具和SQL客户端，支持多种数据库系统。它基于Java开发，具备跨平台能力，可以在Windows、macOS和Linux系统上运行。目录安装DBeaver 连接MySQL数据库安装DBeaver 进入DBeaver官网 DBeaver Communit…

阅读更多...

【钱包】WEB3钱包APP框架的设计

【钱包】WEB3钱包APP框架的设计一、前言前段时间，自己做了一款WEB3钱包APP，从产品设计到框架搭建都是我一个人搞的，更多的参考了其他公司的钱包APP。在此，想把自己的钱包经验分享出来，帮助没有做过钱包APP的同学开…

阅读更多...

openGL学习(基本窗口)

学习路线学习 OpenGL 需要掌握一系列基础知识和技能，这些内容涵盖了计算机图形学的基本概念、编程语言、数学知识以及 OpenGL 的具体 API 使用。以下是学习 OpenGL 所需的主要知识点： 1. 计算机图形学基础图形学概念：了解图形学的基本概…

阅读更多...

无人机防护装置技术解析

一、技术要点 1. 侦测防御系统多频谱复合探测整合无线电侦测（20MHz–6GHz频段扫描）、雷达探测、光电跟踪（可见光/红外/激光）技术，实现360无死角监测。例如神州明达系统可5公里内识别无人机信号，并同步…

阅读更多...

最新文章