TCP/IP 全卸载中的 LSO(Large Send Offload)LRO(Large Receive Offload) 是网卡硬件加速技术,其核心目标是 将 TCP/IP 协议栈的处理任务从 CPU 转移到网卡硬件,从而大幅降低 CPU 负载并提升网络性能。以下是详细解释:


1. LSO(Large Send Offload)发送端卸载

  • 问题背景
    当应用程序发送大量数据时(例如 64KB 文件),操作系统需要将数据拆分成多个 MTU 大小(如 1500B)的 TCP 分段。传统方式由 CPU 完成分片、封装 TCP/IP 头部,消耗大量 CPU 资源。
  • LSO 工作原理
    1. 操作系统将 完整的大数据块(如 64KB) 直接传递给网卡驱动。
    2. 网卡硬件自动完成:
      • 将大数据块按 MTU 拆分成小分段。
      • 为每个分段生成 TCP/IP 头部(序列号、校验和等)。
      • 仅通过一次 DMA 请求获取数据,减少 PCIe 交互次数。
  • 性能收益
    • CPU 开销降低 90%+(例如发送 64KB 数据,CPU 中断次数从 40+ 次减少到 1 次)。
    • 吞吐量提升:100GbE 网卡可达 94 Gbps(接近线速)。

2. LRO(Large Receive Offload)接收端卸载

  • 问题背景
    接收大量 TCP 分段时,CPU 需逐个重组数据包、验证校验和,导致高中断频率和延迟。
  • LRO 工作原理
    1. 网卡硬件在接收端缓存 属于同一 TCP 流的分段
    2. 将多个分段合并为 单个大数据包(例如将 50 个 1500B 包合并为 75KB)。
    3. 仅向 CPU 提交合并后的数据包,减少中断次数。
  • 性能收益
    • CPU 中断频率降低 10–50 倍(取决于数据流特征)。
    • 延迟降低:小包处理延迟从 20μs 降至 5μs

3. 全卸载技术栈(完整 TCP/IP 卸载)

现代智能网卡(如 NVIDIA ConnectX)进一步扩展了卸载范围:

卸载功能说明硬件实现效果
TCP 校验和网卡计算 IPv4/IPv6/TCP/UDP 校验和消除 CPU 校验计算开销
TSO(TCP Segmentation Offload)LSO 的增强版,支持 IPv6/VLAN大文件传输零 CPU 干预
RSS(Receive Side Scaling)多队列分流到不同 CPU 核心避免单核瓶颈,提升并行性
VXLAN/GENEVE 封装卸载覆盖网络隧道封装/解封装虚拟化网络性能无损

4. 性能对比(启用 vs 禁用卸载)

100GbE 网络传输 64KB 数据 为例:

指标禁用卸载(传统 CPU 处理)启用 LSO/LRO(硬件卸载)
CPU 占用率80% (8 核心满载)8% (单核轻度负载)
中断次数43 次(发送+接收)2 次(发送 1 次 + 接收 1 次)
有效吞吐量≤ 40 Gbps94 Gbps
延迟(P99)50μs8μs

5. 技术限制与注意事项

  • 兼容性问题
    • 某些防火墙/IDS 可能因 LRO 合并数据包而丢失原始包信息(需调整配置)。
  • 适用场景
    • 适用:大数据传输(视频流、文件传输)、高吞吐场景。
    • 不适用:低延迟交易系统(需禁用 LRO 避免合并引入延迟)。
  • 演进技术
    • GRO(Generic Receive Offload):Linux 内核的软件级 LRO 替代方案,更灵活但效率低于硬件 LRO。
    • USO(UDP Segmentation Offload):针对 UDP 的类似优化(如 NVIDIA ConnectX-6 以上支持)。

英伟达网卡的实现优势

ConnectX-7 为例:

  • 硬件加速引擎:内置 FlexParser™ 技术,可卸载包括 TCP、VXLAN、TLS 在内的复杂协议。
  • 动态负载均衡:结合 RSS + Flow Steering,自动分配流量到多核 CPU。
  • RoCE 集成:LSO/LRO 与 RDMA 协同工作,实现 端到端零拷贝(例如 GPU Direct RDMA)。

💡 总结:LSO/LRO 是智能网卡的核心卸载技术,通过 硬件替代 CPU 处理网络协议分片/重组,彻底释放 CPU 算力,使 100GbE/400GbE 网络的性能瓶颈从 CPU 转移到物理链路本身。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86593.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86593.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/86593.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抖音小程序支付错误码141211

前情 uni-app是我比较喜欢的跨平台框架,它能开发小程序/H5/APP(安卓/iOS),重要的是对前端开发友好,自带的IDE让开发体验也挺棒的,公司项目就是主推uni-app 公司今年准备新开一个项目,但是对项目的未来和项目要做的规…

springcloud/springmvc协调作用传递验证信息

微服务架构的拆分,各模块之间使用feign组件来进行相互http转发通信。 前端与后端之间使用springcloud的网关来进行协调。 现在问题出现,用户的信息如何进行传递? 前端请求携带请求头,请求头中的authorization为携带的对应token…

Apache Flink Kafka 写连接器源码深度剖析

一、架构概述 Apache Flink 提供的 Kafka 写入连接器是实现与 Kafka 消息队列集成的关键组件,支持多种语义保证和灵活配置选项。本文将深入分析 Flink Kafka 写入连接器的源码实现,包括架构设计、核心类、事务机制和性能优化等方面。 1.1 整体架构 Fl…

强化学习理论基础:从Q-learning到PPO的算法演进(2)

文章目录 Policy gradient思想(REINFORCE算法)优势函数PPO(Proximal Policy Optimization)Policy gradient思想(REINFORCE算法) 下面我们来探讨一下Policy gradient策略,也就是REINFORCE算法。 在玩剪刀石头布这个简单的游戏中,我们可以有不同的策略。一种是完全随机地…

Oracle数据库文件变成32k故障恢复--惜分飞

最近一个客户数据库重启系统之后,数据文件大小变为了32kb,我接手的不是第一现场(客户那边尝试了rman还原操作),查看alert日志,数据库最初报错 Wed Jun 18 13:09:23 2025 alter database open Block change tracking file is current. Read of datafile D:\APP\ADMINISTRATOR\OR…

移动端 uniapp 写一个可自由拖拽的小键盘

写之前要考虑&#xff1a; 键盘展开后&#xff0c;不能超过手机边缘在底部展开键盘&#xff0c;键盘应出现在展开按钮上方&#xff1b;以此类推重复点击展开按钮&#xff0c;关闭键盘 效果&#xff1a; 代码如下&#xff0c;有些按键逻辑还需要优化 <template><vi…

《二分枚举答案(配合数据结构)》题集

文章目录 1、模板题集2、课内题集3、课后题集1. 字符串哈希2. 并查集3. ST表 1、模板题集 分巧克力 2、课内题集 倒水 冶炼金属 连续子序列的个数 3、课后题集 括号内的整数代表完整代码行数。 1. 字符串哈希 你猜猜是啥题(60) 2. 并查集 拯救萌萌(72) 3. ST表 GCD不小…

PY32F030单片机,优势替代ST GD,主频48MHz,带LED数码管驱动

PY32F030是一款高性能32位单片机&#xff0c;采用ARM Cortex-M0内核&#xff0c;工作频率高达48MHz&#xff0c;具备64KB Flash和8KB SRAM。它支持1.7V~5.5V宽电压范围&#xff0c;集成多路I2C、SPI、USART通讯外设&#xff0c;配备12位ADC、16位定时器和比较器&#xff0c;适用…

Rockchip Uboot中修改固件探测的存储介质

Rockchip Uboot中修改固件探测的存储介质 Rockchip uboot中支持从 eMMC、SDcard、NAND 、SPI_NAND、SPI_NOR等存储介质引导固件。 uboot的spl启动的时候会默认呢都会去探测这些介质&#xff0c;这样会导致探测时间变长&#xff0c;在实际产品中可以根据产品需求进行个性化的配…

动手学Python:从零开始构建一个“文字冒险游戏”

动手学Python&#xff1a;从零开始构建一个“文字冒险游戏” 大家好&#xff0c;我是你的技术向导。今天&#xff0c;我们不聊高深的框架&#xff0c;也不谈复杂的算法&#xff0c;我们来做一点“复古”又极具趣味性的事情——用Python亲手打造一个属于自己的文字冒险游戏&…

基于Kafka实现企业级大数据迁移的完整指南

在大数据时代&#xff0c;数据迁移已成为企业数字化转型过程中的常见需求。本文将详细介绍如何利用Kafka构建高可靠、高性能的大数据迁移管道&#xff0c;涵盖从设计到实施的完整流程。 一、为什么选择Kafka进行数据迁移&#xff1f; Kafka作为分布式消息系统&#xff0c;具有…

GEO引领品牌大模型种草:迈向Web3.0与元宇宙的认知新空间

在数字技术的演进历程中&#xff0c;我们正经历着从Web2.0到Web3.0、从平面互联网到沉浸式元宇宙的范式转变。这一转变不仅重塑了数字空间的形态和交互方式&#xff0c;更深刻改变了品牌与用户的连接模式和价值创造逻辑。而在这个新兴的数字疆域中&#xff0c;生成式引擎优化&a…

【机器学习与数据挖掘实战 | 医疗】案例18:基于Apriori算法的中医证型关联规则分析

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈机器学习与数据挖掘实战 ⌋ ⌋ ⌋ 机器学习是人工智能的一个分支,专注于让计算机系统通过数据学习和改进。它利用统计和计算方法,使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联…

83、高级特性-自定义starter细节

83、高级特性-自定义starter细节 自定义Spring Boot Starter可以将通用功能封装成可复用的模块&#xff0c;简化其他项目的配置和使用。以下是创建自定义Starter的详细步骤和关键细节&#xff1a; ### 1. 项目结构 通常&#xff0c;自定义Starter包含两个模块&#xff1a; ####…

专注推理查询(ARQs):一种提升大型语言模型指令遵循度、决策准确性和防止幻觉的结构化方法

大型语言模型&#xff08;LLMs&#xff09;在客户服务、自动化内容创作和数据检索方面变得至关重要。然而&#xff0c;它们的有效性常常因其在多次交互中无法始终如一地遵循详细指令而受到限制。在金融服务和客户支持系统等高风险环境中&#xff0c;严格遵循指南是必不可少的&a…

华为云Flexus+DeepSeek征文 | DeepSeek驱动的医疗AI Agent:智能问诊系统开发完整指南

华为云FlexusDeepSeek征文 | DeepSeek驱动的医疗AI Agent&#xff1a;智能问诊系统开发完整指南 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 总有一行代码&#xff0c;能点亮万千星辰。 &#x1f50d; 在技术的宇宙中&#xff0c;我愿做永不停歇…

【大模型水印论文阅读2】前缀文本编码、均匀性约束

TOC &#x1f308;你好呀&#xff01;我是 是Yu欸 &#x1f680; 感谢你的陪伴与支持~ 欢迎添加文末好友 &#x1f30c; 在所有感兴趣的领域扩展知识&#xff0c;不定期掉落福利资讯(*^▽^*) 写在最前面 版权声明&#xff1a;本文为原创&#xff0c;遵循 CC 4.0 BY-SA 协议。…

破茧时刻,与光同行

凌晨五点的闹钟刺破薄雾&#xff0c;我摸黑打开台灯。摊开的数学错题本上&#xff0c;函数图像在暖黄的光晕里舒展&#xff0c;像等待破译的密码。这样的清晨已持续三百多个日夜&#xff0c;我知道&#xff0c;在无数个相似的时刻里&#xff0c;总有千万盏台灯在黑暗中次第亮起…

Learning PostgresSQL读书笔记: 第8章 Triggers and Rules

本章将讨论以下内容&#xff1a; • 探索 PostgreSQL 中的规则 • 管理 PostgreSQL 中的触发器 • 事件触发器 探索 PostgreSQL 中的规则 文档中的这段话阐述了rule和trigger的区别&#xff1a; PostgreSQL 规则系统允许定义在数据库表中插入、更新或删除时执行的替代操作。粗…

信创国产化替代中的开发语言选择分析

在信息技术应用创新(信创)国产化替代过程中&#xff0c;选择合适的开发语言至关重要。以下是适合信创环境的开发语言及其优势分析&#xff1a; 主流适合信创的编程语言 1. Java 优势&#xff1a;跨平台特性(JVM)、丰富的生态体系、企业级应用成熟 信创适配&#xff1a;国内有…