传统网络架构的困境

在 AI 算力爆发的今天,数据中心网络正经历前所未有的流量形态变革。传统 Clos 网络架构依赖逐流 ECMP 均衡算法,其设计逻辑基于 “大量短流” 假设,通过五元组 HASH 实现负载分担。然而 AI 训练场景呈现出鲜明的流量特征:

  • 大象流主导:少数长流占据 60% 以上带宽(如图 1),HASH 均衡导致流量集中于少数路径
  • 时延敏感性:参数同步的通信模式要求微秒级时延稳定性,传统网络丢包会引发模型训练时间指数级增长
  • 多租户隔离需求:GPU 资源池化催生网络切片需求,传统 VRF 实现方式难以与动态负载均衡协同

这种结构性矛盾导致传统网络在 AI 场景下陷入 “高带宽利用率与低转发效率” 的悖论,亟需从架构层实现突破。

智能网络架构的核心技术突破

动态智能选路技术构建了 “感知 - 决策 - 执行” 的闭环体系,通过三大创新重构网络行为逻辑:

全维度路径质量感知体系

1、硬件级实时测量

基于 ASIC 寄存器实现百毫秒级带宽 / 队列统计(如图 2),通过 SAI 接口实时采集端口转发计数,经加权平均算法(近时数据权重提升 30%)生成链路负载指数。

图2

2、纳秒级时延追踪

转发时延计算因子基于INT(In-band Network Telemetry)技术,精度可达纳秒级。HDC(High Delay Capture)是一种能捕获 ASIC 中经历高延迟的数据包信息的 INT 技术。

通过使用 HDC,星融元交换机能够捕获任何超过用户指定延迟阈值的数据包的延迟信息,并将原始数据包的前150字节连同元数据(包含出入端口、时延等关键信息)作为 HDC 数据包发送到收集器。

图3

动态智能选路技术在星融元交换机上开启 HDC 功能,并将 CPU 作为 HDC 的收集分析器,通过分析 HDC 报文实现高精度测量交换机转发时延,并将时延信息作为路径质量评价因子,提高路径质量评价精度。

命令行配置 HDC 功能控制INT进程运行,之后通过 socket 连接进行收包循环,将收取到的报文进行解析并将关键信息(出入端口、转发时延等)写入数据库。

动态智能决策引擎

1、BGP 协议深度扩展

定义 Path Bandwidth 扩展社区属性(类型 0x0005),将路径质量以 IEEE 浮点格式(GB/s)编码于 BGP 报文中。在 Leaf-Spine 两层架构中,通过三级权重计算(Leaf 下行口 ×Spine 口 ×Leaf 上行口)生成端到端路径质量值(如图 4)。

图4

2、动态 WCMP 权重计算

突破传统 ECMP 的等价分配模式,根据路径质量动态生成权重比例。例如双路径质量值 38:80 时,自动计算 3:7 的流量分配比(如图 5),并通过 BGP 实时同步全网,实现秒级负载均衡调整。

图5

细粒度流量调度执行

1、Flowlet 级智能负载均衡

ALB 技术在 ASIC 层实现微流级调度,实时监测出端口负载与队列时延(如图 6)。当单链路负载超过阈值时,自动将后续 Flowlet 导向低负载路径,配合端口 fail-over 机制实现零丢包故障切换。

图6

2、多租户隔离增强

通过 VRF 与 PRE ACL 联动实现流量切片:源 IP 匹配 VRF 网段时自动打标(如图 7),确保不同租户流量在独立路由表中转发,同时支持跨 VRF 的动态质量感知,保障 GPU 资源池的隔离性与调度效率。

图7

智算网络的应用场景

动态WCMP如何化解流量洪峰

在 256×400G GPU 集群中,采用 1:1 收敛比的两层 Clos 架构(如图 8),传统 ECMP 因无法感知路径状态,常导致单 Spine 节点拥塞率超 45%。动态智能选路技术通过全路径质量计算,将拥塞率控制在 3% 以内,同时提升带宽利用率 22%。

图8

假设 Server1 的 GPU1 要与 Server17 的GPU1通信,按照传统 ECMP 的逻辑,流量会选择Spine中的一个然后到达 Leaf17,传统 ECMP 不会感知路径实时状态,所以 AI 场景下的少量大象流极易被均衡到同一 Spine 上从而导致 Leaf1 上行端口拥塞甚至出现丢包。

如果交换机开启了动态智能选路技术,当 Server17 将 GPU1 的路由信息通过 Leaf17 向整网通告时,首先 Leaf17 会将自身通往 Server17-GPU1 的路径质量附带在路由通告中发给所有 Spine,然后每个 Spine 将自身通往 Leaf17 的路径质量累积在路由通告中发给 Leaf1,Leaf1 将自身通往 Leaf17 的路径质量继续累积在路由信息中,此时 Leaf1 上有到达 Server17-GPU1 的全路径以及每条路径对应的路径质量,Leaf1 先去掉路径质量异常的路径(如质量较低路径认为不适合进行流量转发),再根据综合路径质量计算剩余路径的权重,形成 WCMP,指导流量转发。

Flowlet级负载均衡

以上述 256 个 400G 的 GPU 组网为例,如果使用了动态智能选路技术,但是不是每台设备都适合使用动态 WCMP,则交换机会动态选择基于 flowlet 的 ALB 进行流量的负载均衡。整网形成 ECMP 之后,ASIC的 ALB 功能会实时测量 ECMP 组中不同链路上负载和时延,将 flowlet 路由到负载更⼩或时延更低的链路上。

如图所示,Leaf1 上的多个指向Spine的链路同时负载流量,当红色接口负载流量较高,转发时延过长,此时 ASIC 基于 flowlet 做 ECMP 时,会自动跳过红色路径对应的出口,直到该出口负载和转发时延恢复正常值之后,ECMP 才会再选中该端口进行流量转发。

更多详细内容,请访问星融元官网https://asterfusion.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:
http://www.pswp.cn/pingmian/85497.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85497.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85497.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件测试题

选择题 1、导致软件缺陷的原因有很多,①—④是可能的原因,其中最主要的原因包括( )。 ①软件需求说明书编写的不全面,不完整,不准确,而且经常更改 ②软件设计说明书 ③软件操作人员的水平 ④开发人员不能很好的…

微信小程序页面容器弹出层

效果图 .JS Page({data: {show: false,duration: 300,position: right,round: false,overlay: true,customStyle: ,overlayStyle: },popup(e) {const position e.currentTarget.dataset.positionlet customStyle let duration this.data.durationswitch(position) {case to…

Excel批量计算时间差

执行以下操作,将自定义格式代码应用到单元格: 选择相应的单元格。在"开始"选项卡上的"数字"组中,单击"常规"框旁边的箭头,然后单击"其他数字格式"。在"设置单元格格式"对话框…

shell脚本--变量

1.变量是什么 2.变量类型 3.动态,静态,强弱类型 4.变量的命名 5.变量的定义和引用 5.1三种变量类型 普通变量 环境变量 局部变量 5.2单引号,双引号,强弱引用 双引号对变量赋值的影响01:59:给变量加双引号&#x…

大模型Text2SQL之在CentOS上使用yum安装与使用MySQL

前言 学习大模型的时候需要一个mysql,原因还是在公司使用电脑的时候不允许按照Docker-Desktop,我的宿主机其实是MAC,我习惯上还是在centsos上面安装,就发现这件过去很简单的事情居然捣鼓了我蛮久,记录一下。 容器环境 我直接安…

机器人大脑的进化:Physical Intelligence如何用“知识隔离“破解VLA模型三大难题

目录 引言:当GPT遇上机器人手臂 第一章:VLM 与 VLA的介绍 VLM (Vision-Language Model) - 视觉语言模型 VLA (Vision-Language Agent) - 视觉语言智能体 VLM和VLA的对比 第二章:VLA模型的进化史 - 从"口述指挥"到"精确控…

LeetCode 662. 二叉树的最大宽度

文章目录 LeetCode 662. 二叉树的最大宽度题目描述思路Golang 代码 LeetCode 662. 二叉树的最大宽度 记录一次刷题的感悟。这道题目是我人生第一次面试的时候的手撕题目,但临场的时候面试官没有为难我,他考察的问题是求二叉树的最大宽度,但是…

【linux】bash脚本中括号问题

在 Bash 脚本里,中括号 [ ] 其实是 test 命令的同义词,[ 是一个命令,] 是该命令的最后一个参数,所以中括号内外的空格会影响命令执行,下面详细说明: 中括号内侧空格 中括号内侧与操作数之间必须有空格&…

Ruoyi(若依)整合websocket实现信息推送功能(消息铃铛)

实现消息推送功能 来了,来了,大家做系统应该是最关心这个功能。 【思路】 需求:对全系统【所有的业务操作】进行消息推送,有【群发】、【私发】功能、处理【消息状态(未读/已读)】,websocket持…

小白的进阶之路系列之十五----人工智能从初步到精通pytorch综合运用的讲解第八部分

torch.nn 究竟是什么? PyTorch 提供了设计精良的模块和类,如 torch.nn、torch.optim、Dataset 和 DataLoader,帮助你创建和训练神经网络。为了充分利用它们的能力并根据你的问题进行定制,你需要真正理解它们到底在做什么。为了帮助你理解这一点,我们将首先在不使用这些模…

JavaScript 数据结构详解

最近在复习JavaScript的基础知识,和第一次学确实有了很不一样的感受,第一次学的比较浅,但是回头再进行学习的时候,发现有很多遗漏的东西,所以今天想分享一下新学到的知识,后面会一点一点补充更新 JavaScrip…

c++面试题(14)------顺时针打印矩阵

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个元素。 例如: 输入矩阵: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]输出&…

《Go语言圣经》defer

《Go语言圣经》defer 核心概念:defer语句的执行时机 defer是Go语言的一个关键字,它的作用是:延迟执行一个函数调用,该调用会在包围它的函数返回前一刻执行。 关键点: defer语句会在函数即将返回时执行,…

WEB3 的 WebSocket Provider连接方式

1. 什么是 WebSocket Provider? WebSocket Provider 是 web3.js 中用于通过 WebSocket 协议 与以太坊节点(如 Infura、Geth、Parity)建立持久化连接的通信方式。它允许双向实时数据传输,适用于需要实时监听区块链事件的场景。 核心特点 双向通信:客户端和服务器可以主动…

三国大模型:智能重构下的乱世文明图谱

引言:当赤壁烽烟遇见深度学习 一件动态的《全本三国演义》正通过全息投影技术演绎群雄逐鹿的史诗。这个虚实交融的场景,恰似三国大模型技术的隐喻——以人工智能为纽带,连接起汉末三国的烽火狼烟与数字时代的文明重构。作为人工智能与历史学…

AWS数据库迁移实战:本地MySQL零停机上云方案

一、迁移场景 本地环境&#xff1a;自建MySQL 5.7&#xff08;数据量500GB&#xff09;&#xff0c;业务要求迁移停机时间<5分钟 目标架构&#xff1a; 二、迁移四步法 步骤1&#xff1a;环境准备&#xff08;耗时30分钟&#xff09; 1.1 创建Aurora MySQL # AWS CLI创…

uni-app 安卓 iOS 离线打包参考

App 离线打包 原生工程配置 安卓&#xff1a;【uniapp】uniapp 离线打包安卓应用或者云打包发布 app 步骤&问题记录 iOS&#xff1a;uni-app实现XCode苹果本地离线打包APP

mysql History List Length增长

HLL 持续增长导致问题 History List Length&#xff08;HLL&#xff09;是InnoDB存储引擎中用于衡量未清理的undo日志记录数量的指标。当HLL持续增长时&#xff0c;可能对数据库性能和业务产生以下影响&#xff1a; 事务处理延迟增加 高HLL值意味着大量未清理的undo日志&…

VMware替代 | 南京地铁采用ZStack ZSphere虚拟化承载核心业务

南京地铁作为中国主要城市轨道交通系统之一&#xff0c;运营规模庞大&#xff0c;地铁线路覆盖全市主要区域。其核心业务系统&#xff08;包括列车调度、信号控制、乘客信息系统等&#xff09;原部署在VMware平台上。然而&#xff0c;随着VMware产品全面转向订阅制&#xff0c;…

Electron自动更新详解—包教会版

★ 本人在公司项目中实现的Electron更新功能。 ★ 将实现更新过程的每一步都总结了出来&#xff0c;以及过程中我遇到了哪些问题&#xff0c;如何去解决的问题&#xff0c;有哪些注意事项。 ★ 使用贴合实际应用的HTTP服务器做为载体实现更新&#xff0c;而非github。 开始&…