diannao/2025/7/3 22:05:24/文章来源:https://blog.csdn.net/songpeiying/article/details/149073882

1. `netem corrupt 5%` 的作用

功能说明

corrupt 5% 表示 随机修改 5% 的数据包内容（如翻转比特位），模拟数据损坏。
它本身不会直接丢弃或延迟数据包，而是让接收端收到错误的数据（可能触发校验和失败、协议层重传等）。

为何带宽骤降？

关键问题：netem 的 corrupt 操作需要 逐包处理（修改数据包内容），这会引入显著的 CPU 开销。
性能瓶颈：
- 当发送速率极高（如 5.26 Gbps）时，netem 可能无法实时处理所有数据包，导致 队列堆积。
- 默认情况下，netem 使用内核的 Qdisc 内核线程（软中断）处理数据包，其处理能力远低于专用硬件（如网卡 DMA）。
- 当队列满时，内核会触发 TCP 拥塞控制（如降低发送窗口），最终表现为带宽骤降。

2. 验证原因：观察 `netem` 队列状态

方法 1：检查 Qdisc 队列长度

bash

tc -s qdisc show dev enp4s0

输出示例：

	`qdisc netem 1: root refcnt 2 limit 1000 packets # 默认队列长度为 1000 包`
	`Sent 1234567 packets 567890123 bytes (123.45 MB)`
	`dropped 0 overlimits 0 requeues 0`

关键指标：
- limit 1000 packets：队列最大容量。
- overlimits：因队列满而丢弃的数据包数（若增加，说明队列堆积）。
- 若 overlimits 为 0 但带宽仍骤降，可能是 netem 处理延迟导致发送端主动降速。

方法 2：监控 CPU 使用率

bash

	`top -p $(pgrep -f "ksoftirqd") # 观察软中断线程（处理 Qdisc）`
	`mpstat -P ALL 1 # 查看各 CPU 核心负载`

预期现象：
- 使用 netem 时，某个 CPU 核心的 si（软中断）使用率会接近 100%。
- 高 CPU 负载会导致内核无法及时处理数据包，触发发送端降速。

3. 为什么 `corrupt` 比 `delay`/`loss` 更影响性能？

操作类型	内核处理开销	典型带宽影响
`delay`	低（仅修改时间戳）	几乎无影响（除非延迟极大）
`loss`	低（直接丢弃包）	线性降速（如 5% 丢包 → 带宽约降 5%）
`corrupt`	高（需逐包修改数据）	可能引发指数级降速（因拥塞控制）

corrupt 的特殊性：
- 修改数据包内容后，接收端的 TCP 栈会检测到校验和错误，触发 快速重传 或 RTO（超时重传）。
- 重传会导致发送端 降低发送窗口，进一步限制带宽。
- 若 netem 处理速度跟不上发送速率，队列堆积会加剧这一过程。

4. 如何验证是 `netem` 性能瓶颈而非其他问题？

实验 1：替换为 `loss` 测试

	`# 移除原有规则`
	`sudo tc qdisc del dev enp4s0 root`

	`# 添加 5% 丢包规则（低开销）`
	`sudo tc qdisc add dev enp4s0 root netem loss 5%`

	`# 重新运行 iperf3`
	`iperf3 -c <接收端IP> -t 30`

预期结果：

带宽会线性下降约 5%（如从 5.26 Gbps 降至 ~5 Gbps），不会骤降至 7 Mbps。
说明 corrupt 的高开销是主因。

实验 2：降低发送速率测试

bash

	`# 限制 iperf3 发送速率为 100 Mbps`
	`iperf3 -c <接收端IP> -b 100M -t 30`

	`# 同时保持 netem corrupt 5%`
	`sudo tc qdisc add dev enp4s0 root netem corrupt 5%`

预期结果：

带宽可能稳定在 ~95 Mbps（5% 损坏影响），不会骤降。
说明高发送速率下 netem 处理能力不足。

5. 解决方案

方案 1：降低 `netem` 处理压力

减少影响范围：

	`# 仅对特定流量应用 corrupt（如通过 iptables 标记）`
	`sudo iptables -A PREROUTING -p tcp --dport 1234 -j MARK --set-mark 1`
	`sudo tc qdisc add dev enp4s0 root handle 1: prio`
	`sudo tc filter add dev enp4s0 parent 1: protocol ip prio 1 u32 match ip dport 1234 0xffff action mirred egress redirect dev netem_if`
	`# 需创建虚拟设备或使用其他方法限制流量`

（更简单的方法是直接降低测试速率）

降低损坏比例：

sudo tc qdisc change dev enp4s0 root netem corrupt 0.5% # 从 5% 降至 0.5%

方案 2：使用硬件加速（如 DPDK）

若需高精度模拟损坏且保持高性能，可考虑：
- 使用 DPDK 的 pktgen 工具（用户态处理，绕过内核瓶颈）。
- 专用网络测试仪（如 Ixia、Spirent）。

方案 3：接受性能下降（测试目的）

如果目标是 验证系统在错误下的行为（如 TCP 重传、应用层超时），带宽骤降是合理现象。
此时应关注：
- 接收端是否正确处理损坏数据（如 TCP 校验和失败）。
- 应用层是否触发容错机制（如重试、降级）。

6. 总结

现象	原因	是否正常
带宽从 5.26 Gbps 骤降至 7 Mbps	`netem corrupt 5%` 的高 CPU 开销导致队列堆积，触发 TCP 拥塞控制	正常（但需明确测试目标）
`corrupt` 比 `loss`/`delay` 更影响性能	修改数据包内容需要逐包处理，开销远高于丢弃或延迟	预期行为
低发送速率下 `corrupt` 不导致骤降	`netem` 处理能力足够时，带宽仅受损坏比例影响	验证了瓶颈来源

建议：

若需测试高带宽下的错误处理，改用 loss 或 delay，或降低 corrupt 比例。
若需精确模拟损坏，接受性能下降，并监控 TCP 重传等指标。

# 延迟

sudo tc qdisc add dev enp1s0 root netem delay 100ms 1000ms

# 服务器限速（丢弃超额包）
tc qdisc add dev enp1s0 root netem loss 10% 丢弃

# 在接收端添加损坏规则# 5% 概率损坏包
sudo tc qdisc add dev enp1s0 handle 1: root netem corrupt 5%

限制发送端带宽
# sudo tc qdisc add dev enp4s0 root netem rate 100mbit

#sudo tc qdisc add dev eth0 root tbf rate 100mbit burst 32kbit latency 400ms

使用 tc（流量控制工具）在网卡 eth0 上创建一个 TBF（令牌桶过滤器） 根队列规则，限制出口流量速率为 100Mbps，允许突发流量最多 32Kbit，并设置最大延迟为 400毫秒，从而实现基础的流量整形和限速。

删除
#tc qdisc del dev enp4s0 root

查看
#tc qdisc show dev enp4s0

无法识别 netem 队列规则（qdisc）类型，通常是因为缺少必要的内核模块或配置。以下是解决步骤：

1. 检查内核模块是否加载

netem 需要 sch_netem 内核模块支持。运行以下命令检查并加载模块：

sudo modprobe sch_netem

如果模块不存在，可能需要安装内核扩展包（见步骤2）。

2. 安装内核扩展包（如未安装）

在基于RHEL/CentOS的系统上，确保安装了内核扩展包：

	`sudo yum install kernel-modules-extra # CentOS/RHEL 7/8`
	`# 或`
	`sudo dnf install kernel-modules-extra # Fedora/RHEL 9+`

3. 验证模块是否加载

运行以下命令确认模块已加载：

lsmod | grep netem

如果看到 sch_netem，则模块已加载。

4. 重新尝试添加qdisc

加载模块后，重新执行你的命令：

sudo tc qdisc add dev ens22f0 root netem rate 100mbit

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/diannao/89514.shtml
繁体地址，请注明出处：http://hk.pswp.cn/diannao/89514.shtml
英文地址，请注明出处：http://en.pswp.cn/diannao/89514.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Flask YAML管理工具

Flask YAML管理工具

项目概述项目地址：https://github.com/KaiqiZing/Flask_Yaml_Demo 这是一个基于Flask开发的YAML文件管理工具，提供了完整的YAML文件查看、编辑、管理功能，具有现代化的Web界面和强大的编辑能力。核心功能 1. 文件管理功能目录扫描&am…

阅读更多...

Embedding模型微调实战（ms-swift框架）

Embedding模型微调实战（ms-swift框架）

目录简介 1. 创建虚拟环境 2 安装ms-swift 3安装其他依赖库 4. 下载数据集 5.开始embedding模型训练 6. 自定义数据格式和对应的Loss类型 （1） infoNCE损失 (2)余弦相似度损失 (3)对比学习损失 （4).在线对比学习损失 &#…

阅读更多...

从性能优化赛到社区Committer，走进赵宇捷在Apache Fory的成长之路

从性能优化赛到社区Committer，走进赵宇捷在Apache Fory的成长之路

Apache Fory 是一个基于JIT和零拷贝的高性能多语言序列化框架，实现了高效紧凑的序列化协议，提供极致的性能、压缩率和易用性。在多语言序列化框架技术领域取得了重大突破，推动序列化技术步入高性能易用新篇章！这一切，都…

阅读更多...

Python实例题：基于 Flask 的任务管理系统

Python实例题：基于 Flask 的任务管理系统

目录 Python实例题题目要求： 解题思路： 代码实现： Python实例题题目基于 Flask 的任务管理系统要求： 使用 Flask 框架构建一个任务管理系统，支持以下功能： 用户认证（注册、登录、…

阅读更多...

利用GPU加速TensorFlow

利用GPU加速TensorFlow

一、写在前面我们已经依靠keras和TensorFlow给大家做了一些机器学习在图像处理中的应用(影像组学学习手册,基于深度学习的图像分类任务)，此前的教程中我们没有用GPU进行加速，但是相较于CPU而言，GPU是设计用于处理大规模并行计算任务的硬件&…

阅读更多...

模型预测专题：强鲁棒性DPCC

模型预测专题：强鲁棒性DPCC

0 1 前言在进行DPCC的学习过程中，于下面链接看到了一篇强鲁棒性算法；感觉挺有意思的，学习一下。永磁同步电机高性能控制算法（12）——基于预测电流误差补偿的强鲁棒预测控制/参数辨识&有限集预测控制与连续集预…

阅读更多...

修复opensuse 风滚草rabbitmq的Error: :plugins_dir_does_not_exist问题

修复opensuse 风滚草rabbitmq的Error: :plugins_dir_does_not_exist问题

https://wiki.archlinux.org/title/Talk:RabbitMQ 报错 yqh192 /u/l/r/l/r/plugins> sudo rabbitmq-plugins enable rabbitmq_management Error: :plugins_dir_does_not_exist Arguments given:enable rabbitmq_managementUsagerabbitmq-plugins [--node <node>] [--…

阅读更多...

前端做gis地图有哪些库

前端做gis地图有哪些库

以下是前端开发GIS地图常用的库： Leaflet：轻量级、易于使用的开源JavaScript库，具有丰富的地图功能和插件生态系统，支持多种地图数据源，适合初学者和专业开发者。其优势在于简洁性和易用性，代码结构清晰&am…

阅读更多...

赋能城市安全韧性|众智鸿图总裁扈震受邀出席智慧城市大会发表主题报告

赋能城市安全韧性|众智鸿图总裁扈震受邀出席智慧城市大会发表主题报告

——“众智鸿图作为城市基础设施智能化综合服务提供商，以地理信息科学、时空大数据、人工智能为核心能力，长期深耕于燃气、供水、排水等城市基础设施生命线领域及港口、园区等工业领域，致力于为城市稳定运行与高效发展提供坚实保障。” 2025年…

阅读更多...

【大语言模型入门】—— 浅析LLM基座—Transformer原理

【大语言模型入门】—— 浅析LLM基座—Transformer原理

【大语言模型入门】—— 浅析LLM基座—Transformer原理解密GPT核心技术：Transformer架构深度解析被反复强调的核心概念意味着什么？ GPT预测机制解析：从Next Token Prediction到任务推理核心机制的本质案例驱动的机制解析解构策略&#xff1a…

阅读更多...

Django打造智能Web机器人控制平台

Django打造智能Web机器人控制平台

Django 实现 Web 机器人控制以下是关于 Django 实现 Web 机器人控制管理的实例思路和关键代码片段，涵盖多个常见场景。由于篇幅限制，剩余的可通过类似模式扩展。基础机器人模型定义 # models.py from django.db import modelsclass Robot(models.Model):name = models.C…

阅读更多...

周赛98补题

周赛98补题

题目意思： 给定一个数字判断加上自身任意因子数，是否能成为一个奇数。思路： 我们想一个最简单的判断方法， 任意的数字的因子数都有1，故，最简单的方法就是判断奇偶。奇数1成偶数，偶数1成奇…

阅读更多...

【STM32】 STM32低功耗模式详解：睡眠模式与唤醒机制【待测试】

【STM32】 STM32低功耗模式详解：睡眠模式与唤醒机制【待测试】

本篇知识点基于F0讲解一、STM32三种低功耗模式参考表格模式功耗唤醒时间保持状态典型应用场景睡眠模式中等 (mA级)最短 (μs级)CPU停止，外设保持短暂待机，快速响应停止模式低 (μA级)中等 (ms级)RAM保持，时钟停止长时间待机，电…

阅读更多...

【Vue入门学习笔记】Vue核心语法

【Vue入门学习笔记】Vue核心语法

目录准备工作删除不需要的代码模版语法文本插值使用JavaScript表达式无效写法原始HTML 属性绑定简写布尔型Attribute动态绑定多个值准备工作删除不需要的代码删除components下的文件进入App.vue 删掉代码，只保留如下内容 <template></template&g…

阅读更多...

ClickHouse 窗口分析 argMax() / argMin()

ClickHouse 窗口分析 argMax() / argMin()

argMin() 是 ClickHouse 中一个非常有用的聚合函数，它可以找出某个列的最小值，并返回该最小值对应的另一个列的值函数语法 argMin(arg, val) arg：要返回的列（当找到最小值时返回该列的值） val：用于比较的…

阅读更多...

k8s client 通过KubeConfig和证书方式连接api server

k8s client 通过KubeConfig和证书方式连接api server

一、背景本文以kubePi这样一个k8s客户端为示例，使用证书方式，怎么连接k8s集群。然后告诉你证书是如何生成的，最后通过一个Python编程示例，在程序里如何使用。 api server地址：比如https://110.206.56.308:6443 Certificate：证书内容 Certificate Key：证书的私钥先…

阅读更多...

（2025.07）解决——ubuntu20.04系统开机黑屏，左上角光标闪烁

（2025.07）解决——ubuntu20.04系统开机黑屏，左上角光标闪烁

前面一些碎碎念： 电脑装的双系统，之前都还好着，今天突然ubuntu开机的时候黑屏了，左上角有光标在闪烁，也查了一些资料，基本上大家的都是驱动有问题，还有内存问题。（个人建议&#xff…

阅读更多...

一文讲清libmodbus在STM32上基于FreeRTOS的移植

一文讲清libmodbus在STM32上基于FreeRTOS的移植

libmodbus 开发库概述 libmodbus是一个免费的跨平台支持RTU和TCP的Modbus库，遵循LGPL V2.1协议。libmodbus支持Linux、 Mac Os X、 FreeBSD、 QNX和Windows等操作系统。 libmodbus可以向符合Modbus协议的设备发送和接收数据，并支持通过串口或者TCP网络进…

阅读更多...

go语言安装达梦数据完整教程

go语言安装达梦数据完整教程

一、安装 go-dm 驱动 1. 使用 go get 命令安装 # 打开PowerShell或命令提示符 go get github.com/dmdbms/go-dm# 若网络问题，配置代理 go env -w GOPROXYhttps://goproxy.cn,direct2. 验证驱动安装 go list -m github.com/dmdbms/go-dm# 预期输出类似 github.com…

阅读更多...

华为云Flexus+DeepSeek征文｜基于Dify构建音视频内容转录工作流

华为云Flexus+DeepSeek征文｜基于Dify构建音视频内容转录工作流

华为云FlexusDeepSeek征文｜基于Dify构建音视频内容转录工作流一、构建音视频内容转录工作流前言二、构建音视频内容转录工作流环境2.1 基于FlexusX实例的Dify平台2.2 基于MaaS的模型API商用服务三、构建音视频内容转录工作流实战3.1 配置Dify环境3.2 配置Dify工具…

阅读更多...

最新文章