归一化(Normalization)是一种将数据转换到相同尺度的预处理技术,它通常用于让不同特征(或数据项)具有相同的量纲或范围。在联邦学习中,归一化可以用来处理非独立同分布(Non-IID)**数据中的差异,确保不同客户端的训练过程具有可比性,从而有效地提高模型的稳定性和准确性

1. 归一化的基本概念

归一化的目标是将数据缩放到特定的范围内,常见的范围是 [0, 1] 或 [-1, 1]。通过这种方式,可以消除数据中由于量纲差异或尺度差异带来的影响,使得不同客户端的梯度或损失值在同一个尺度上进行比较。

常用的归一化方法有:

  • 最小-最大归一化(Min-Max Normalization):将数据缩放到指定的范围(通常是 [0, 1])。

  • Z-score标准化(Z-score Normalization):通过数据的均值和标准差对数据进行标准化。

2. 最小-最大归一化(Min-Max Normalization)

最小-最大归一化是最常用的归一化方法之一。它将数据按比例缩放到 [0, 1] 之间,公式如下:

其中:

  • X 是原始数据(例如,客户端的损失值或梯度值)。

  • X_{\text{min}}X_{\text{max}} 分别是数据中的最小值和最大值。

  • X_{\text{normalized}}是归一化后的数据。

例子解释

假设5个客户端的损失值如下:

客户端损失值
A0.8
B1.2
C0.9
D0.7
E5.0
  • 最小值X_{\text{min}}) = 0.7

  • 最大值X_{\text{max}}) = 5.0

那么,归一化后的损失值计算如下:

最终的归一化损失值如下:

客户端原始损失值归一化后损失值
A0.80.0233
B1.20.1163
C0.90.0465
D0.70
E5.01

通过归一化方法,所有客户端的损失值都被缩放到了相同的范围内,便于进行比较。

3. Z-score标准化

Z-score标准化是另一种常见的数据归一化方法,它将数据变换为均值为0、标准差为1的分布。公式如下:

其中:

  • X 是原始数据(例如,客户端的损失值或梯度值)。

  • \mu 是数据的均值(所有数据的平均值)。

  • \sigma 是数据的标准差(数据的离散程度)。

例子解释

假设使用上述的损失值(A: 0.8, B: 1.2, C: 0.9, D: 0.7, E: 5.0)。

标准化后的值

最终的标准化结果:

客户端原始损失值标准化后损失值
A0.8-0.556
B1.2-0.313
C0.9-0.494
D0.7-0.612
E5.01.993

通过Z-score标准化后,所有客户端的损失值以均值0、标准差1的方式呈现,避免了数据尺度对分析的影响。

4. 选择哪种归一化方法?

  • 最小-最大归一化:适用于你已知数据的范围,并且希望将所有数据缩放到一个固定范围内。通常用于算法对特定范围敏感的情况,比如在神经网络中,激活函数(如Sigmoid)通常对归一化数据较为敏感。

  • Z-score标准化:适用于数据分布较为复杂,或者你不确定数据的范围时。它不受到极端值的影响,适用于大多数基于距离的算法(如KNN、SVM等)和一些优化算法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/98073.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/98073.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/98073.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业级实战:构建基于Qt、C++与YOLOv8的模块化工业视觉检测系统

一、概述 在追求高效与精密的现代制造业中,自动化光学检测(AOI)已成为保障产品质量的核心技术。传统的质检流程往往受限于人工效率与主观判断,难以满足大规模、高精度的生产需求。本文旨在研发一套完整的、企业级的工业视觉异常检…

【目标检测】metrice_curve和loss_curve对比图可视化

代码如下: import warnings warnings.filterwarnings(ignore)import os import pandas as pd import numpy as np import matplotlib.pylab as pltpwd os.getcwd()names [model1, model2, model3,ours]plt.figure(figsize(10, 10))plt.subplot(2, 2, 1) for i in …

【LeetCode hot100|Week2】滑动窗口,子串

笔记用于个人复习和巩固,题解非原创,参考LeetCode官方题解以及各个大佬的解法,希望给大家带来帮助,同时笔记也能督促我学习进步 这周主要把滑动窗口和子串的题目刷了一遍 文章目录Week2D1 滑动窗口209. 长度最小的子数组713. 乘积…

vue2纯前端对接海康威视摄像头实现实时视频预览

vue2纯前端对接海康威视摄像头实现实时视频预览一、环境准备二、代码集成1.1 准备webrtcstreamer.js,粘贴即用,不用做任何修改1.2 封装视频组件,在需要视频的地方引入此封装的视频组件即可,也是粘贴即用,注意其中impor…

Android 设置禁止截图和禁止长截图

1.禁止截图 在 Activity 代码中 , 可以在调用 setContentView 函数之前 ,为 Window 窗口对象 设置 LayoutParams.FLAG_SECURE 标志位 , 可以禁止对本界面进行截屏 ,Window 窗口对象 , 可通过 getWindow 方法获取 ,核心代码如下 :getWindow().setFlags(LayoutParams.FLAG_SECUR…

AR 巡检在工业的应用|阿法龙XR云平台

AR 巡检的应用覆盖电力、石油化工、智能制造、轨道交通、冶金等对设备可靠性和安全性要求极高的行业,具体场景包括:电力行业变电站内设备的状态检查:通过 AR 眼镜扫描设备,实时显示设备额定参数、历史故障记录、实时传感器数据&am…

【C++】STL详解(七)—stack和queue的介绍及使用

✨ 坚持用 清晰易懂的图解 代码语言, 让每个知识点都 简单直观 ! 🚀 个人主页 :不呆头 CSDN 🌱 代码仓库 :不呆头 Gitee 📌 专栏系列 : 📖 《C语言》🧩 《…

深度学习周报(9.8~9.14)

目录 摘要 Abstract 1 LSTM相关网络总结与对比 1.1 理论总结 1.2 代码运行对比 2 量子计算入门 3 总结 摘要 本周首先总结了LSTM、Bi-LSTM与GRU的区别与优缺点,对比了三者实战的代码与效果,还另外拓展了一些循环神经网络变体(包括窥视…

Quat 四元数库使用教程:应用场景概述

基础概念 四元数是一个包含四个元素的数组 [x, y, z, w],其中 x,y,z表示虚部,w 表示实部。单位四元数常用于表示3D空间中的旋转。 1. 创建和初始化函数 create() - 创建单位四元数 应用场景:初始化一个新的四元数对象,通常作为其他…

【Java后端】Spring Boot 多模块项目实战:从零搭建父工程与子模块

如何用 Spring Boot 搭建一个父工程 (Parent Project),并在其中包含多个子模块 (Module),适合企业级项目或者需要分模块管理的场景。Spring Boot 多模块项目实战:从零搭建父工程与子模块在日常开发中,我们经常会遇到这样的需求&am…

企业级AI会议系统技术实现:快鹭如何用AI重构会议全流程

摘要 本文深度解析快鹭AI会议系统的核心技术架构,重点探讨其在语音识别、自然语言处理、数据集成和安全防护等方面的技术实现。通过对比传统会议系统的技术痛点,分析快鹭AI如何通过技术创新实现会议筹备时间减少67%、数据调取速度提升100倍的显著效果。…

【CSS学习笔记3】css特性

1css三大特性 1.1层叠性:就近原则,最新定义的样式 1.2继承性:子标签集成父标签的样式,如文本和字号 行高的继承:不加单位指的是当前文字大小的倍数 body {font: 12px/1.5 Microsoft YaHei;color: #be1313;} div {…

[C语言]常见排序算法①

1.排序的概念及常见的排序算法排序在咱们日常生活中十分的常见,就好比是网上购物的时候通常能够选择按照什么排序,比如价格、评论数量、销量等。那么接下来咱们就来了解一些关于排序的概念。排序:所谓排序,就是使一串记录&#xf…

文献阅读笔记:RS电子战测试与测量技术文档

信息来源:罗德与施瓦茨(Rohde & Schwarz)公司关于电子战(Electronic Warfare, EW)测试与测量解决方案专业技术文档。 该文档由台湾地区应用工程师Mike Wu撰写,核心围绕电子战基础、雷达系统、实战应用及…

别再纠结 Postman 和 Apifox 了!这款开源神器让 API 测试更简单

别再纠结 Postman 和 Apifox 了!这款开源神器让 API 测试更简单🔥 作为一名开发者,你是否还在为选择 API 测试工具而纠结?Postman 太重、Apifox 要联网、付费功能限制多?今天给大家推荐一款完全免费的开源替代方案 ——…

微调神器LLaMA-Factory官方保姆级教程来了,从环境搭建到模型训练评估全覆盖

1. 项目背景 开源大模型如LLaMA,Qwen,Baichuan等主要都是使用通用数据进行训练而来,其对于不同下游的使用场景和垂直领域的效果有待进一步提升,衍生出了微调训练相关的需求,包含预训练(pt)&…

创建其他服务器账号

✅ 在 /home74 下创建新用户的完整步骤1. 创建用户并指定 home 目录和 shellsudo useradd -m -d /home74/USERNAME -s /bin/bash USERNAME-m:自动创建目录并复制 /etc/skel 默认配置文件(.bashrc 等)。-d:指定用户 home 路径&…

【WebGIS】Vue3使用 VueLeaflet + 天地图 搭建地图可视化平台(基础用法)

初始化 创建项目 nodejs 18.0.6npm 9.5.1 引入地图服务 VueLeaflet GitHub - vue-leaflet/vue-leaflet: vue-leaflet 与 vue3 兼容 Vue Leaflet (vue2-leaflet) package.josn安装版本 直接添加四个依赖 {// ..."scripts": {// ...},"depen…

OpenCV 开发 -- 图像阈值处理

文章目录[toc]1 基本概念2 简单阈值处理cv2.threshold3 自适应阈值处理cv2.adaptiveThreshold更多精彩内容👉内容导航 👈👉OpenCV开发 👈1 基本概念 图像阈值处理(Thresholding)是图像处理中的一种基本技术…

单串口服务器-工业级串口联网解决方案

在工业自动化、智能电网、环境监测等领域,传统串口设备(如PLC、传感器、仪表等)的网络化升级需求日益增长。博为智能单串口服务器凭借高性能硬件架构、多协议支持和工业级可靠性,为RS485设备提供稳定、高效的TCP/IP网络接入能力&a…