news/2025/7/25 8:08:45/文章来源:https://blog.csdn.net/Kent_Li/article/details/149582898

问题描述：

在多分类任务的评估报告中，经常看到 micro avg、macro avg 和 weighted avg 三种平均指标，请解释它们的区别以及各自的适用场景。

🎯 参考答案：

这三种平均指标是用来评估多分类模型性能的不同方式，它们在计算方法和应用场景上有显著区别：

1. `micro avg`（微观平均）

计算方式：

将所有类别的 TP（真正例）、FP（假正例）、FN（假负例）汇总后统一计算指标。
公式：
$\text{Precision}_{micro} = \frac{\sum TP}{\sum TP + \sum FP}, \quad \text{Recall}_{micro} = \frac{\sum TP}{\sum TP + \sum FN}$

特点：

不区分类别，将所有预测结果视为一个整体；
等价于 accuracy（准确率）；
对样本量大的类别更敏感；
适用于类别不平衡的情况。

适用场景：

关注整体预测准确性；
各类别样本分布严重不均时。

2. `macro avg`（宏观平均）

计算方式：

分别计算每个类别的 Precision、Recall、F1，然后取平均值。
公式：
$\text{Precision}_{macro} = \frac{1}{N} \sum_{i=1}^{N} \text{Precision}_i, \quad \text{Recall}_{macro} = \frac{1}{N} \sum_{i=1}^{N} \text{Recall}_i$

特点：

每个类别权重相等；
不考虑样本数量差异；
可能被少数类别"拖累"；
适用于各类别同等重要的场景。

适用场景：

各类别同等重要；
需要均衡评估每个类别的表现。

3. `weighted avg`（加权平均）

计算方式：

按每个类别的 support（样本数）加权平均各项指标。
公式：
$\text{Precision}_{weighted} = \frac{\sum (\text{Precision}_i \times \text{Support}_i)}{\sum \text{Support}_i}$

特点：

考虑了类别样本分布；
更贴近真实业务评估；
大类别对结果影响更大。

适用场景：

真实数据分布下的性能评估；
更具业务参考价值。

📊 实际案例分析：

假设某模型在 15 个类别上的表现如下（部分）：

类别	Precision	Recall	F1-score	Support
sports	0.84	0.81	0.82	26
edu	0.34	0.75	0.47	28
stock	0.00	0.00	0.00	1

最终评估结果为：

指标	Precision	Recall	F1-score
`micro avg`	0.4990	0.4940	0.4965
`macro avg`	0.5132	0.4795	0.4714
`weighted avg`	0.5475	0.4940	0.4914

分析：

micro avg 接近整体准确率；
macro avg 被 stock 类拖累；
weighted avg 反映了多数类（如 sports）的良好表现。

✅ 总结对比表：

指标	是否考虑类别权重	适用场景	特点
`micro avg`	❌	整体准确率评估	受大类影响大
`macro avg`	❌	各类同等重要	可能被小类拖累
`weighted avg`	✅	真实业务评估	更贴近实际表现

💡 面试加分点：

能结合具体数据解释三者差异；
能指出在类别不平衡时应优先关注 weighted avg 或 micro avg；
能提出优化建议（如针对低分小类增加数据）。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/news/915731.shtml
繁体地址，请注明出处：http://hk.pswp.cn/news/915731.shtml
英文地址，请注明出处：http://en.pswp.cn/news/915731.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Kafka灰度方案

Kafka灰度方案

一、kafka灰度方案架构设计方案：1、外部生产-内部消费场景：（外部生产-内部消费）解决方案：先通过kdis分流服务---消费外部生产的消息，然后根据管理后台-灰度配置mcs-mimp-core应用默认的环境版本&#xff0c…

阅读更多...

深入详解K近邻算法（KNN）在脑部疾病诊断中的应用与实现

深入详解K近邻算法（KNN）在脑部疾病诊断中的应用与实现

🧑 博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++, C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQL server,Oracle,mysql,postgresql等进行开发应用…

阅读更多...

黑马点评练习题-给店铺类型查询业务添加缓存(String和List实现)

黑马点评练习题-给店铺类型查询业务添加缓存(String和List实现)

目录一、前言二、需求三、String实现四、List实现一、前言这是黑马点评实战篇-商户查询缓存-0.3缓存练习题分析，练习给店铺类型查询业务添加缓存。这里我自己是通过String实现的，当然在网上查询也能够找到其他的实现方式。String实现我会展示自…

阅读更多...

深度学习 pytorch图像分类（详细版）

深度学习 pytorch图像分类（详细版）

目录一、项目简介二、模型训练验证保存三、模型测试保存csv文件四、单张图片预测五、模型评估六、ONNX导出七、ONNX推理八、网络结构与数据增强可视化上篇我介绍了具体步骤，今天就以我实际开发的一个具体项目来讲： 一、项目简介苯人的…

阅读更多...

《AR眼镜上声学的应用与挑战》

《AR眼镜上声学的应用与挑战》

《2025GAS声学大讲堂—音频产业创新技术公益讲座》智能眼镜专题讲座第3讲将于7月24日周四19点开讲，本次邀请了珠海莫界科技有限公司高级算法工程师胡立天演讲，讲座主题：《AR眼镜上声学的应用与挑战》（点击观看直播&#xff09…

阅读更多...

编译支持cuda硬件加速的ffmpeg

编译支持cuda硬件加速的ffmpeg

本来以为很简单，因为印象中自己在windows机器上使用过。目前的实在一个docker环境下的ubuntu系统里。官方操作文档按照官方操作文档Using FFmpeg with NVIDIA GPU Hardware Acceleration - NVIDIA Docs的描述，步骤很简单： 1、安装nv-c…

阅读更多...

在资源受限单片机中使用printf等可变参函数时的陷阱（2025年7月22日）

在资源受限单片机中使用printf等可变参函数时的陷阱（2025年7月22日）

今天分享一个我最近在项目调试中遇到的“大坑”，这个坑来自一个我们既熟悉又依赖的朋友——printf函数。故事的主角，是一颗资源极其有限的STM32F030单片机，它只有区区4KB的RAM。一切始于便利项目初期，为了能方便地监控程序运行状…

阅读更多...

大数据之Hive:Hive中week相关的几个函数

大数据之Hive:Hive中week相关的几个函数

目录1.dayofweek函数2.weekday函数3.weekofyear函数1.dayofweek函数功能：统计某天为星期几 dayofweek(date) - Returns the day of the week for date/timestamp (1 Sunday, 2 Monday, ..., 7 Saturday).dayofweek返回值为：1-7，1 星期…

阅读更多...

基于深度学习Transform的steam游戏特征分析与可视化【词云-情感词典分析-主题分析-词频分析-关联分析】

基于深度学习Transform的steam游戏特征分析与可视化【词云-情感词典分析-主题分析-词频分析-关联分析】

文章目录有需要本项目的代码或文档以及全部资源，或者部署调试可以私信博主一、项目背景与研究意义二、研究目标三、研究方法与实施流程第一阶段：数据采集与预处理第二阶段：多维度数据分析第三阶段：综合分析与策略建议输出四、预期…

阅读更多...

Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

一、模型概述与上下文支持能力 1.1 Qwen3-8B 的技术特点 Qwen3-8B 是通义实验室推出的 80 亿参数大语言模型，支持 32,768 token 的上下文长度。其核心优化点包括： FP8 量化技术：通过将权重从 32-bit 压缩至 8-bit，显著降低显存…

阅读更多...

recvmsg函数的用法

recvmsg函数的用法

recvmsg 是 Linux 网络编程中用于接收消息的高级系统调用，支持复杂数据结构和辅助数据的接收，适用于 TCP/UDP/UNIX 域套接字等场景‌。以下是其核心用法详解：‌1. 函数原型与参数‌#include <sys/socket.h> ssize_t recvmsg(int sockfd…

阅读更多...

24GSPS高速DA FMC子卡

24GSPS高速DA FMC子卡

单通道 16bit 12GSPS/ 12bit 15.5GSPS/ 8bit 24GSPS双通道 16bit 6.2GSPS/ 12bit 7.75GSPS/ 8bit 12GS/sDAC FMC子卡基于TI公司的高速DAC数模转换器DAC39RF12ACK和时钟芯片LMX2594而设计的标准单槽位的FMC子卡。支持单通道模式或双通道模式，单通道模式下提供16bit 1…

阅读更多...

LabVIEW动态调用VI

LabVIEW动态调用VI

该组LabVIEW程序演示4 种动态调用 VI 的实现方案，围绕 HTTP GET 任务（通过 URL 抓取数据），利用不同调用逻辑，适配多场景下的并行 / 串行执行需求，助力工程师灵活构建异步、并行化程序。各方案说明&#xff…

阅读更多...

安装单机版本Redis

安装单机版本Redis

部署操作:步骤一: 安装Redis服务# 安装redis操作 dnf install redis -y步骤二： 修改Redis相关配置vim /etc/redis/redis.conf # 83行附件， 修改为 * -::* 任意的服务都可以连接redis服务 bind * -::*#908行附近： 打开requirepass&#xff…

阅读更多...

Java(Set接口和HashSet的分析)

Java(Set接口和HashSet的分析)

Set 接口基本介绍:注意:取出的顺序的顺序虽然不是添加的顺序，但是他的固定set接口的常用方法:和 List 接口一样, Set 接口也是 Collection 的子接口，因此，常用方法和 Collection 接口一样.set的遍历方式:HashSet的全面说明:HashSet的畅通方法…

阅读更多...

vscode不识别vsix结尾的插件怎么解决?

vscode不识别vsix结尾的插件怎么解决?

当VS Code无法识别.vsix文件时，可能是由于文件损坏、版本不兼容或安装流程不正确导致的。以下是解决此问题的详细步骤： 1. 确认文件完整性重新下载.vsix文件：删除现有文件，从可靠来源重新下载，确保下载过程未中断。检…

阅读更多...

面试题：sql题一

面试题：sql题一

SELECTp.product_id, -- 产品IDp.product_name, -- 产品名称SUM(s.sale_qty * s.unit_price) AS sum_price, -- 年销售总价YEAR(s.sale_date) AS year_date -- 销售年份 FROM products p JOIN sales s ON p.product_id s.produ…

阅读更多...

【React-Three-Fiber实践】放弃Shader！用顶点颜色实现高性能3D可视化

【React-Three-Fiber实践】放弃Shader！用顶点颜色实现高性能3D可视化

在现代前端开发中，3D可视化已经成为提升用户体验的重要手段。然而，许多开发者在实现复杂视觉效果时，往往会首先想到使用Shader（着色器）。虽然Shader功能强大，但学习曲线陡峭，实现复杂度高。本文…

阅读更多...

MSTP技术

MSTP技术

一、STP/RSTP 的局限性STP（生成树协议）和 RSTP（快速生成树协议）存在一些明显的局限，主要包括：所有 VLAN 共享一颗生成树，这导致无法实现不同 VLAN 在多条 Trunk 链路上的负载分担。例如&#xf…

阅读更多...

[IMX][UBoot] 16.Linux 内核移植

[IMX][UBoot] 16.Linux 内核移植

目录 1.修改 Makefile 2.新增配置文件 3.新增设备树文件 4.新建编译脚本 5.修改 CPU 频率 6.EMMC 适配 7.网络驱动适配 1.修改 Makefile 修改顶层 Makefile 中的架构信息 ARCH 和交叉编译器 CROSS_COMPILE，修改后不需要在执行 make 时手动指定这两个变量的值…

阅读更多...

最新文章