混淆矩阵

混淆矩阵是一个表格,用于总结分类模型在测试集上的预测结果,特别是当真实标签已知时。它将预测结果分为四种情况(记忆:实际和预测一致为True,预测为正是Positive):

  • 真正例: 实际为正类,预测也为正类 (True Positive, TP)

  • 假正例: 实际为负类,但预测为正类 (False Positive, FP

  • 假反例: 实际为正类,但预测为负类 (False Negative, FN

  • 真反例: 实际为负类,预测也为负类 (True Negative, TN)

真实标签 \ 预测标签正类 (Positive)负类 (Negative)
正类 (Positive)TPFN
负类 (Negative)FPTN

 准确率(Accuracy)

  • 定义: 模型预测正确(TP+TN)的样本数占总样本数(TP+FP+FN+TN)的比例。最直观的指标。

  • 计算公式:
    Accuracy = (TP + TN) / (TP + FP + FN + TN)

  • 意义:

    • 衡量模型整体预测正确的比例。

    • 优点: 简单易懂。

    • 缺点: 在数据不平衡时容易产生误导。例如,在疾病检测中,健康人(负类)占99%,病人(正类)占1%。一个将所有样本都预测为健康的模型,准确率也能达到99%,但这个模型对于检测病人是完全无效的。此时需要更细致的指标。

  • 适用场景: 当正负类样本比例大致相同时,准确率是一个合理的指标。

精确率(Precision)

  • 定义: 在模型预测为正类(TP+FP)的样本中,实际也是正类(TP)的样本所占的比例。衡量预测的“精准度”或“可靠性”。

  • 计算公式:
    Precision = TP / (TP + FP)

  • 意义:

    • 关注的是预测结果的质量。高精确率意味着模型预测为正类的样本中,误报(FP)的比例低。

    • 核心问题: 当模型说某个样本是正类时,这个判断有多可信?

  • 适用场景: 当需要尽量减少“假警报”或“误报”时非常重要。

    • 垃圾邮件检测: 将正常邮件误判为垃圾邮件(FP)很糟糕。需要高精确率,确保标记为垃圾邮件的邮件确实是垃圾邮件。

    • 推荐系统: 向用户推荐的商品,希望推荐列表中的商品用户确实感兴趣(高TP),避免推荐不相关的商品(低FP)。

 召回率(Recall)

  • 定义: 在实际为正类(TP+FN)的样本中,被模型正确预测为正类(TP)的样本所占的比例。衡量模型的“查全率”或“覆盖度”。

  • 计算公式:
    Recall = TP / (TP + FN)

  • 意义:

    • 关注的是模型找出所有正类样本的能力。高召回率意味着模型漏报(FN)的比例低。

    • 核心问题: 在所有实际的正类样本中,模型成功找出了多少?

  • 适用场景: 当需要尽量减少“漏检”或“错过”正类样本时非常重要。

    • 疾病诊断: 漏掉一个真正的病人(FN)后果可能很严重。需要高召回率,尽可能找出所有患病者。

    • 欺诈检测: 漏掉一个欺诈交易(FN)会导致损失。需要高召回率,尽可能识别出所有欺诈行为。

    • 信息检索: 希望搜索引擎返回的结果尽可能包含所有相关的文档(高TP),避免遗漏(FN)。

F1 分数(F1 Score)

  • 定义: 精确率召回率调和平均数(倒数平均数:总体各统计变量倒数算术平均数倒数。旨在用一个分数综合反映模型的精确率和召回率。1/((1/Precision+1/Recall)/2).

  • 计算公式:
    F1 Score = 2 * (Precision * Recall) / (Precision + Recall)

    • 调和平均数的特点:更重视较小值。只有当精确率和召回率都高时,F1分数才会高。

  • 意义:

    • 提供一个在精确率和召回率之间取得平衡的单一指标。

    • 特别适用于数据不平衡的情况,或者当同时关注精确率和召回率且需要找到一个折中点时。

    • 比简单的算术平均更能反映模型的整体性能(当精确率和召回率差异较大时)。

  • 适用场景:

    • 当需要同时考虑精确率和召回率,且没有明确偏向哪一个更重要时。

    • 评估在不平衡数据集上模型的综合性能。

    • 比较不同模型时的一个常用综合指标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/90044.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/90044.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/90044.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零搭建Cloud Alibaba

1.初始环境的搭建 1.1环境要求: Spring Boot 3.2.5: 基于最新的 Spring Framework 6.x。支持现代化开发模式,帮助开发更加高效。 JDK 17 或更高版本: Spring Boot 3.x 开始要求 Java 17 作为最低运行环境。 Spring Boot 与 Sp…

Spring AI 工具调用

文章目录简述工具定义工具上下文直接返回方法:直接返回工具执行框架控制工具执行用户控制的工具执行异常处理简述 工具调用(也称为函数调用)是 AI 应用程序中的一种常见模式,允许模型与一组 API 或工具进行交互,从而增…

GitHub 趋势日报 (2025年07月20日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图2033maybe737remote-jobs674Hyprland581n8n572shadPS4341bknd281Resume-Matcher249…

替代标准库:实用 C++ 开源组件推荐

C17 及 C20 引入了许多现代化的标准库组件,如 std::filesystem、std::optional、std::format、std::chrono 的增强,以及 std::expected 等。然而,在一些项目中,受限于老版本编译器、不完善的标准库实现,或跨平台兼容性…

夯实基础:配置Java开发环境JDK与构建工具Maven

摘要:在前面两个章节中,我们一同探讨了Spring Boot的革命性优势,并深入其内部,理解了起步依赖、自动配置和内嵌容器这三大核心基石。理论的铺垫是为了更稳健的实践。从本章开始,我们将正式“卷起袖子”,搭建…

PyCharm 未正确关联 .jpg 为图片格式

1. PyCharm 未正确关联 .jpg 为图片格式PyCharm 可能错误地将 .jpg 文件识别为文本文件,导致无法预览图片。解决方法手动关联 .jpg 为图片格式:Windows/Linux: File → SettingsmacOS: PyCharm → Preferences进入 Editor → File Types。在 Recognized …

DM8数据库Docker镜像部署最佳实践

DM8数据库Docker镜像部署最佳实践一、Docker加载DM8镜像二、Docker创建DM8容器三、验证目录是否挂载成功一、Docker加载DM8镜像 1.下载DM8镜像,由于官网暂未提供docker镜像下载,可通过网盘下载:https://pan.quark.cn/s/fe38ba821a2a 2.打开…

数据结构——树(2)

数据结构基础(12) 文章目录数据结构基础(12)二叉树的先序遍历先序遍历中序遍历后序遍历二叉树的层序遍历由遍历序列构造二叉树前序 中序遍历序列后序 中序遍历序列层序 中序遍历序列二叉树的中序遍历(缺点&#xff…

【C语言进阶】结构体练习:通讯录

要求: 实现一个通讯录。 (1)人的信息: 包括姓名、年龄、性别、电话地址。 (2)功能: ①存放一百个人的信息。 ②增加联系人。 ③删除指定联系人。 ④查找指定联系人。 ⑤修改联系人。 ⑥排序。 ⑦显示联系人。 (3)文件: ①contact.…

缓存三剑客解决方案

缓存三剑客解决方案 1.缓存雪崩 定义: 大量缓存数据在同一时间点集体失效,导致所有请求直接穿透到数据库,引发数据库瞬时高负载甚至崩溃。 解决方案: 设置过期随机值,避免大量缓存同时失效。 // 缓存雪崩防护&#xff…

HTML 页面禁止缩放功能

页面禁止缩放 代码如下&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"utf-8"><meta name"viewport" content"widthdevice-width, initial-scale1, shrink-to-fitno, maximum-scale1.0, us…

在github上搭建自己主页

主要是这篇博客进行一些补充。 第一步照做就行 首先是第二步 克隆仓库到本地 先下载一个git&#xff0c;电脑创建一个新文件夹&#xff0c;然后 git clone xxxxx 注意即使你使用了代理&#xff0c;这里大概率也会报错&#xff0c;Failed to connect to github.com port 443 …

Laravel 框架NOAUTH Authentication required 错误解决方案-优雅草卓伊凡

Laravel 框架NOAUTH Authentication required 错误解决方案-优雅草卓伊凡NOAUTH Authentication required 错误这个错误通常出现在以下几种情况&#xff1a;Redis 认证问题&#xff1a;如果你的应用使用了 Redis 且配置了密码API 认证问题&#xff1a;请求需要认证的 API 端点但…

kafka生产端和消费端的僵尸实例以及解决办法

目录 一 生产端僵尸 1.1 原因 1.2 问题 1.3解决办法 1.4 案例 1.4.1 案例1&#xff1a;生产者崩溃后重启 (同一 transactional.id) 1.4.2 案例2&#xff1a;短暂网络分区导致的脑裂 1.4.3 案例3&#xff1a;正确 - 解决僵尸 1.4.4 案例4&#xff1a;错误 - 无法解决僵…

国产电科金仓数据库金仓KES V9 2025:AI时代的数据库融合标杆

国产电科金仓数据库金仓KES V9 2025&#xff1a;AI时代的数据库融合标杆 在AI技术迅猛发展的今天&#xff0c;企业数据管理面临着前所未有的挑战&#xff1a;异构数据库兼容难题、多数据模型融合需求、高并发场景性能瓶颈、跨中心容灾压力……这些痛点如同数据流转的大问题&am…

【STM32】关于STM32F407写Flash失败问题的解决办法

问题描述 在使用正点原子的STM32F407写flash例程时&#xff0c;发现STMFLASH_Write函数没办法写入数据到flash&#xff0c;原始代码输入下&#xff1a; 随后对每一行代码的结果进行分析&#xff0c;发现87行的“FLASH_ProgramWord(WriteAddr,*pBuffer)”返回值是7&#xff0c;一…

CUDA与RISC-V的融合:打破架构霸权,重塑AI计算未来

当x86和Arm统治数据中心十余年后,一家GPU巨头正悄悄将十亿颗RISC-V核心嵌入其系统。如今,它决定拆除CPU架构的围墙。 2025年7月,上海张江科学会堂。英伟达硬件工程副总裁Frans Sijstermanns在第五届RISC-V中国峰会上宣布:英伟达正式启动CUDA向RISC-V架构的移植工作。 这个…

微信二维码扫描登录流程详解

二维码扫描登录流程细节&#xff08;项目经验&#xff09; 1&#xff1a; 获取二维码信息 PC会优先存放服务器生成的唯一密钥&#xff1a; 比如 source、secret 以密文形式存储大致发送字段&#xff1a; sourcesecretmac(mac 地址) 服务器生成 二维码信息&#xff1a;二维码字符…

日本上市IT企业|8月125日将在大连举办赴日it招聘会

株式会社GSD的核心战略伙伴贝斯株式会社&#xff0c;将于2025年8月25日在大连香格里拉大酒店商务会议室隆重举办赴日技术人才专场招聘会。本次招聘会面向全国范围内的优秀IT人才&#xff0c;旨在为贝斯株式会社东京本社长期发展招募优质的系统开发与管理人才。招聘计划&#xf…

Python 数据分析与可视化:从基础到进阶的技术实现与优化策略

数据分析与可视化是数据科学领域的核心技能,Python 凭借其丰富的库生态和灵活的编程范式,成为该领域的首选工具。本文将系统讲解 Python 数据分析与可视化的技术栈实现,从基础操作到性能优化,结合实战场景提供可复用的解决方案。 数据分析核心库技术解析 Pandas 数据处理…