上一章:机器学习01——机器学习概述
下一章:机器学习03——线性模型
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

文章目录

      • 一、经验误差与过拟合
        • (一)核心概念定义
        • (二)过拟合与欠拟合
      • 二、模型评估方法(数据集划分策略)
        • (一)留出法
        • (二)k折交叉验证法
        • (三)留一法
        • (四)自助法
      • 三、性能度量(模型评价标准)
        • (一)回归任务的性能度量
        • (二)分类任务的性能度量

一、经验误差与过拟合

(一)核心概念定义
  • 误差:样本真实输出与预测输出之间的差异。
  • 误差类型
    • 训练(经验)误差:模型在训练集上的误差;
    • 测试误差:模型在测试集上的误差;
    • 泛化误差:模型在除训练集外所有新样本上的误差(反映模型对新数据的适应能力)。
  • 错误率:分错样本占总样本的比例(是误差的一种具体表现形式)。
(二)过拟合与欠拟合

在这里插入图片描述

  • 过拟合

    • 定义:模型过度学习训练样本的细节(将训练样本的特有性质误认为所有样本的一般性质),导致泛化性能下降;
    • 举例:模型误以为“树叶必须有锯齿”,将无锯齿的树叶误判为“不是树叶”;
    • 解决方法:通过优化目标加正则项(限制模型复杂度)、早停(提前终止训练)等方式缓解。
  • 欠拟合

    • 定义:模型未学好训练样本的一般性质,对数据的规律把握不足;
    • 举例:模型误以为“绿色的都是树叶”,将绿色的非树叶(如绿色果实)误判为“是树叶”;
    • 解决方法:对决策树增加分支、神经网络增加训练轮数等(增强模型对数据的学习能力)。
  • 关键结论:仅追求训练误差最小化(如训练集错误率为0)往往无法得到好模型,需平衡训练误差与泛化能力。

二、模型评估方法(数据集划分策略)

模型评估的核心是通过合理划分训练集(用于训练模型)和测试集(用于评估泛化能力),用测试误差近似泛化误差,且需保证训练集与测试集互斥、分布一致。常见方法包括:

(一)留出法
  • 操作:将数据集直接划分为互斥的训练集S和测试集T;
  • 要点:
    • 保持数据分布一致性(如分层采样,避免某类样本集中在训练集或测试集);
    • 通常多次随机划分并取平均值,减少偶然误差;
    • 训练集与测试集比例多为2:1~4:1(训练集占比更高,保证模型有足够数据学习)。
(二)k折交叉验证法

在这里插入图片描述

  • 操作:将数据集分层采样划分为k个大小相似的互斥子集,每次用k-1个子集的并集作为训练集,剩余1个子集作为测试集,重复k次后取均值;
  • 特点:
    • 常用k=10(即10折交叉验证),平衡评估准确性与计算成本;
    • 为减少划分方式的影响,可重复p次(如“10次10折交叉验证”),最终取p次结果的均值。
(三)留一法
  • 操作:当数据集包含m个样本时,令k=m(即每个子集仅含1个样本),每次用m-1个样本训练,1个样本测试,重复m次取均值;
  • 优缺点:
    • 优点:不受随机划分影响,评估结果准确;
    • 缺点:当m较大时,计算开销极大(需训练m个模型),实用性有限。
(四)自助法
  • 操作:基于有放回采样,从数据集D中采样m次得到训练集(部分样本可能重复),未被采样的样本(约占1/3)作为测试集;
  • 适用场景:数据集较小时(解决训练/测试集划分困难问题);
  • 局限性:改变了原始数据分布,可能引入估计偏差,因此数据量充足时,优先选择留出法或交叉验证法。

三、性能度量(模型评价标准)

性能度量是衡量模型泛化能力的标准,需根据任务需求选择,不同度量可能导致不同评判结果。

(一)回归任务的性能度量
  • 均方误差:最常用指标,计算预测值与真实值差值的平方的平均值,公式为:
    E(f;D)=1m∑i=1m(f(xi)−yi)2E(f ; D)=\frac{1}{m} \sum_{i=1}^{m}\left(f\left(x_{i}\right)-y_{i}\right)^{2}E(f;D)=m1i=1m(f(xi)yi)2
    其中,f(xi)f(x_i)f(xi)为模型预测值,yiy_iyi为真实值,m为样本数。
(二)分类任务的性能度量
  1. 错误率与精度

    • 错误率:分错样本占总样本的比例,公式为:
      E(f;D)=1m∑i=1mI(f(xi)≠yi)E(f ; D)=\frac{1}{m} \sum_{i=1}^{m} \mathbb{I}\left(f\left(x_{i}\right) \neq y_{i}\right)E(f;D)=m1i=1mI(f(xi)=yi)
    • 精度(正确率):分对样本占总样本的比例,公式为:
      acc(f;D)=1m∑i=1mI(f(xi)=yi)=1−E(f;D)acc(f ; D) =\frac{1}{m} \sum_{i=1}^{m} \mathbb{I}\left(f\left(x_{i}\right)=y_{i}\right) =1-E(f ; D)acc(f;D)=m1i=1mI(f(xi)=yi)=1E(f;D)
      I(⋅)\mathbb{I}(\cdot)I()为指示函数,条件成立时取1,否则取0)。
  2. 查准率(P)与查全率(R)
    在这里插入图片描述

    • 基于混淆矩阵(统计真实标记与预测结果的组合):
      • TP(真正例):真实为正例且预测为正例;
      • FN(假反例):真实为正例但预测为反例;
      • FP(假正例):真实为反例但预测为正例;
      • TN(真反例):真实为反例且预测为反例;
    • 查全率(召回率):所有真实正例中被正确预测的比例,公式为:
      R=TPTP+FNR=\frac{TP}{TP+FN}R=TP+FNTP
    • 查准率(精确率):所有预测为正例中真实为正例的比例,公式为:
      P=TPTP+FPP=\frac{TP}{TP+FP}P=TP+FPTP
    • 适用场景:信息检索、Web搜索等(需权衡“找到的正例是否准确”和“是否找到所有正例”)。
  3. P-R曲线与平衡点
    在这里插入图片描述

    • P-R曲线:按模型对正例的预测概率排序,逐个将样本视为正例时,得到的查准率-查全率曲线(直观反映模型在不同阈值下的P和R表现);
    • 平衡点:P-R曲线上查准率=查全率的点,用于比较交叉曲线的模型性能(平衡点越高,模型越好)。
  4. F1与Fβ度量

    • F1:查准率与查全率的调和平均,综合两者性能,公式为:
      F1=2×P×RP+R=2×TP样例总数+TP−TNF1=\frac{2 × P × R}{P+R}=\frac{2 × TP}{样例总数 +TP-TN}F1=P+R2×P×R=样例总数+TPTN2×TP
    • Fβ:更灵活的度量,通过β调整对P和R的偏重:
      Fβ=(1+β2)×P×R(β2×P)+RF_{\beta}=\frac{\left(1+\beta^{2}\right) × P × R}{\left(\beta^{2} × P\right)+R}Fβ=(β2×P)+R(1+β2)×P×R
      • β=1时为标准F1;
      • β>1时偏重查全率(如逃犯检索,需尽可能找到所有逃犯);
      • β<1时偏重查准率(如商品推荐,需推荐的商品尽可能符合用户需求)。

上一章:机器学习01——机器学习概述
下一章:机器学习03——线性模型
机器学习实战项目:【从 0 到 1 落地】机器学习实操项目目录:覆盖入门到进阶,大学生就业 / 竞赛必备

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/98503.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/98503.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/98503.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于 Django 与 Bootstrap 构建的现代化设备管理平台

整体步骤概览 创建项目和应用设计模型&#xff08;Model&#xff09; - 定义设备的数据结构配置用户认证&#xff08;Auth&#xff09; - 使用 Django 自带的强大用户系统创建视图&#xff08;View&#xff09; - 处理业务逻辑&#xff1a;登录、列表、增删改查编写模板&#x…

微软依旧稳定发挥,Windows 最新更新性能「开倒车」

微软在前不久为Release Preview测试用户推送了最新Windows11 25H2版本。按照惯例&#xff0c;正式版将于9月或者10月与咱们见面。虽然看起来是个跨版本的大更新&#xff0c;但是更新方式将服务堆栈更新&#xff08;SSU&#xff09;与最新累积更新&#xff08;LCU&#xff09;。…

一手实测,文心x1.1的升级很惊喜啊

一手实测&#xff0c;文心x1.1的升级很惊喜啊 前言 月9日&#xff0c;在 WAVE SUMMIT深度学习开发者大会上 百度发布了一个新的思考模型文心x1.1&#xff1a; X1 Turbo 升级为 X1.1 了。 文心4.5 Turbo 和 X1 Turbo 是2025年4月25日发布的&#xff0c;距今已经半年过去了&…

Flask 核心基础:从 路由装饰器 到 __name__ 变量 的底层逻辑解析

Flask 核心基础&#xff1a;从路由装饰器到 name 变量的底层逻辑解析 在使用 Flask 开发 Web 应用时&#xff0c;我们总会从 app Flask(__name__) 和 app.route("/") 这两行代码开始。看似简单的语法背后&#xff0c;藏着 Python 装饰器机制与 Flask 框架设计的核心…

中国AI云市场报告:阿里云份额达35.8%,高于2至4名总和

9月9日&#xff0c;国际权威市场调研机构英富曼&#xff08;Omdia&#xff09;发布《中国AI云市场&#xff0c;1H25》报告&#xff0c;报告显示&#xff0c;2025年上半年&#xff0c;中国AI云市场规模达223亿元&#xff0c;阿里云占比35.8%位列第一&#xff0c;市场份额高于2到…

鸿蒙Next开发指南:UIContext接口解析与全屏拉起元服务实战

前言在鸿蒙应用开发过程中&#xff0c;我们经常会遇到需要获取UI上下文实例或者在非UI上下文中调用UI相关方法的场景。随着HarmonyOS NEXT的不断发展&#xff0c;UIContext API为我们提供了更加优雅的解决方案。本文将详细介绍如何使用UIContext中对应的接口获取与实例绑定的对…

leaflet读取mvt格式

如图所示&#xff0c;是全国的数据&#xff0c;截图是部分数据先安装&#xff1a;npm install leaflet npm install leaflet.vectorgrid如果是其余的框架直接用就行&#xff1a;import * as L from leaflet; import leaflet.vectorgrid;我用的是angular,所以是ts中声明&#xf…

OSG中交互(鼠标、键盘)处理

OpenSceneGraph (OSG) 中的交互处理,包括鼠标和键盘事件。 一、OSG 事件处理体系 OSG 使用一个基于访问者模式的事件处理体系,核心类包括: osgGA::GUIEventHandler: 所有事件处理器的基类 osgViewer::Viewer: 查看器,管理事件队列和分发 osgGA::EventQueue: 事件队列…

微硕双N-MOS管WST3392在汽车智能氛围灯系统中的应用

汽车智能氛围灯系统是现代车辆提升驾乘体验的重要配置&#xff0c;其多通道LED的精密调光与控制需选用高性能、小体积的功率开关器件。微硕WINSOK的WST3392是一款双N沟道MOS管&#xff0c;具有30V耐压、3.7A连续电流和46mΩ的低导通电阻&#xff0c;特别适用于氛围灯系统中的多…

深入 Kubernetes:从零到生产的工程实践与原理洞察

&#x1f31f; Hello&#xff0c;我是蒋星熠Jaxonic&#xff01; &#x1f308; 在浩瀚无垠的技术宇宙中&#xff0c;我是一名执着的星际旅人&#xff0c;用代码绘制探索的轨迹。 &#x1f680; 每一个算法都是我点燃的推进器&#xff0c;每一行代码都是我航行的星图。 &#x…

为何三折叠手机只有华为可以?看华为Mate XTs非凡大师就知道

9月4日&#xff0c;华为在深圳举行华为Mate XTs非凡大师及全场景新品发布会&#xff0c;不同于过往手机发布会对芯片配置只字不提&#xff0c;此次发布会公开展示了华为Mate XTs非凡大师内部芯片配置——麒麟9020芯片&#xff0c;时隔四年&#xff0c;终于在发布会上看到芯片公…

TensorFlow 2.x 核心 API 与模型构建

TensorFlow 2.x 核心 API 与模型构建TensorFlow 是一个强大的开源机器学习库&#xff0c;尤其在深度学习领域应用广泛。TensorFlow 2.x 在易用性和效率方面做了大量改进&#xff0c;引入了Keras作为其高级API&#xff0c;使得模型构建和训练更加直观和便捷。本文将介绍 TensorF…

TENGJUN防水TYPE-C连接器:工业级防护,认证级可靠,赋能严苛场景连接

在工业控制、户外电子、水下设备等对连接稳定性与防护性要求极致的场景中&#xff0c;TENGJUN防水TYPE-C连接器以“硬核性能全面认证”的双重优势&#xff0c;成为关键连接环节的信赖之选。从结构设计到认证标准&#xff0c;每一处细节都为应对复杂环境而生&#xff0c;重新定义…

【小呆的随机振动力学笔记】概率论基础

文章目录0. 概率论基础0.1 概率的初步认知0.2 随机变量的分布0.3 随机变量的数字特征0.3.1 随机变量的期望算子0.3.2 随机变量的矩0.4 随机变量的特征函数0.5 高数基础附录A 典型分布0. 概率论基础 \quad\quad在生活中或自然中&#xff0c;处处都存在随机现象&#xff0c;比如每…

使用海康机器人相机SDK实现基本参数配置(C语言示例)

在机器视觉项目开发中&#xff0c;相机的初始化、参数读取与设置是最基础也是最关键的环节。本文基于海康机器人&#xff08;Hikrobot&#xff09;提供的MVS SDK&#xff0c;使用C语言实现了一个简洁的控制程序&#xff0c;完成设备枚举、连接以及常用参数的获取与设置。 &…

【IoTDB】时序数据库选型指南:为何IoTDB成为工业大数据场景的首选?

【作者主页】Francek Chen 【专栏介绍】⌈⌈⌈大数据与数据库应用⌋⌋⌋ 大数据是规模庞大、类型多样且增长迅速的数据集合&#xff0c;需特殊技术处理分析以挖掘价值。数据库作为数据管理的关键工具&#xff0c;具备高效存储、精准查询与安全维护能力。二者紧密结合&#xff0…

用计算思维“破解”复杂Excel考勤表的自动化之旅

在我们日常工作中&#xff0c;经常会遇到一些看似简单却极其繁琐的任务。手动处理一份结构复杂的Excel考勤表&#xff0c;就是典型的例子。它充满了合并单元格、不规则的布局和隐藏的格式陷阱。面对这样的挑战&#xff0c;我们是选择“卷起袖子&#xff0c;日复一日地手动复制粘…

PAT 1006 Sign In and Sign Out

1006 Sign In and Sign Out分数 25作者 CHEN, Yue单位 浙江大学At the beginning of every day, the first person who signs in the computer room will unlock the door, and the last one who signs out will lock the door. Given the records of signing ins and outs, yo…

【git】首次clone的使用采用-b指定了分支,还使用了--depth=1 后续在这个基础上拉取所有的分支代码方法

要解决当前问题&#xff08;从浅克隆转换为完整克隆并获取所有分支&#xff09;&#xff0c;请按照以下步骤操作&#xff1a; 步骤 1&#xff1a;检查当前远程地址 首先确认远程仓库地址是否正确&#xff1a; git remote -v步骤 2&#xff1a;修改远程配置以获取所有分支 默认浅…

萝卜切丁机 机构笔记

萝卜切丁机_STEP_模型图纸免费下载 – 懒石网 机械工程师设计手册 1是传送带 2是曲柄滑块机构&#xff1f; 挤压动作