当前位置: 首页 > ds >正文

AI驱动网络范式革新:Smart Switch与智能路由的协同进化

算力时代的网络困局:路由技术如何破局AI流量洪峰

在GPT-4o参数规模突破10万亿、千卡集群成为AI训练标配的今天,全球互联网正经历着前所未有的流量风暴。当单次模型训练可产生相当于YouTube全球三日流量的数据洪流,当分布式推理系统要求微秒级延迟保障,传统网络架构的流量调度机制正面临系统性崩塌。这场危机的根源是什么?

毫秒级震荡挑战路由响应极限

现代AI计算集群通过AllReduce、参数服务器等分布式架构实现万亿级参数同步,单次训练迭代就能产生持续数百毫秒的流量洪峰。这种周期性突发流量具有以下特征:

  • 振幅剧烈:流量峰值可达网络链路容量的400%,突发带宽需求远超传统拥塞控制机制处理能力

  • 频率密集:典型NVIDIA DGX集群每50-100ms触发一次梯度同步,留给网络调度的时间窗口仅有微秒级

  • 时空叠加:多租户AI任务产生的流量波峰在时间维度交错叠加,在空间维度形成全网级Incast风暴

混合流量形态的撕裂效应

在传统数据中心中,流量类型相对单一(如视频流、网页请求),而AI集群却呈现出极化的流量特征:

  • 大象流(Elephant Flow):单流带宽超100Gbps的模型参数同步,占据总流量的80%以上

  • 老鼠流(Mice Flow):延迟敏感型控制指令(如参数梯度确认),虽仅占流量2%,却直接决定训练效率

  • 脉冲流(Burst Flow):Checkpoint保存引发的瞬时流量尖峰,可达平均流量的50倍

这种混合流量导致传统ECMP(等价多路径)的哈希算法完全失效——大象流长期霸占固定路径造成链路拥塞,而老鼠流被迫绕行高延迟路径,形成"带宽黑洞"与"延迟陷阱"并存的畸形网络。

路由技术演进史:从拓扑感知到流量认知的三次跃迁

为突破上述瓶颈,路由控制平面经历了三个阶段的技术革命:拓扑驱动路由(1960s-2010s),基于OSPF/BGP等协议构建最短路径树。策略驱动路由(2010s-2020s),通过SDN+OpenFlow实现集中式流量工程,但也存在流表项爆炸式增长而导致的资源耗尽。数据驱动路由(2020s-),通过INT(In-band Network Telemetry)技术实现三个维度突破

  • 微秒级感知:在业务报文中嵌入元数据,实时采集逐跳时延、缓存占用等23种关键指标

  • 分布式决策:各节点基于局部INT数据自主决策,规避集中式控制延迟

  • 自适应调度:结合Flowlet检测算法,在保持报文顺序前提下实现μs级路径切换

INT-based Routing:构建AI就绪的确定性网络

以一个典型的Spine-Leaf拓扑的数据中心网络为例。

如上图所示,Server0和Server1分别连接到两个Leaf交换机,这一对Leaf交换机间存在4个路径。

在Server侧看不到这4个路径,因此智能网卡无法实现流量调度。

在Leaf交换机上,如果仅依赖OSPF,能看到4条静态的等价路径,但它们的负载实际上是不同的。

如果借助INT的感知能力,Leaf1交换机上现在就能够知道去往Server0有4条时延不相等的路径。这样Leaf1交换将能够选择更优的策略将流量分配到这4条路径上,如最小时延路径或者WCMP(Weighted Cost Multiple Path),从而实现完全自适应的路由,让网络流量和网络负载完全匹配,最大化网络的吞吐量、最小化尾部延迟,最大化网络利用率。

INT-Based Routing可以与Packet Spray和flowlet结合,实现逐包级别或逐flowlet级别的流量调度。借助OSPF和BGP的拓扑发现能力,它能够在任意拓扑的网络上应用。

相比传统的ECMP技术,INT-Based Routing可将网络利用率提升到90%以上,网络吞吐量提升20~45%, P99 tail latency 降低50%以上,从而显著提高AI训练的作业完成时间(JCT)。

OSPF擅长在链路级别感知网络拓扑,BGP则擅长在AS级别感知网络拓扑,INT通过逐跳嵌入元数据,彻底解决了原来单个交换机无法动态感知整个路径上流量和负载的问题。它们的结合释放出强大的流量调度能力。

从静态配置到动态感知,从集中控制到分布式智能,路由协议的演进史本质上是网络“认知能力”的升级史。当AI将流量变为一场瞬息万变的风暴时,唯有赋予网络“神经感知”与“自主决策”能力,才能让算力真正流动起来。

新路由范式将带来新一轮网络设备升级

AI的发展告诉我们,当我们做更多更有效率的分布式计算,就可以改变世界。网络本身又何尝不是如此。当我们在交换机中对网络拓扑、网络流量和设备负载进行实时分布式计算后,我们就能大幅改善网络的性能。

Smart Switch的基本构成是“可编程的ASIC数据平面 + DPU化的控制平面 + 控制平面到控制平面的高速数据通道”。

Smart Switch 是“网络智能化”的结构性演进。它不再依赖主机上的智能网卡、也不依赖集中控制器,而是将 “实时感知 + 智能调度” 嵌入网络最核心的物理单元Switch中,使网络成为分布式计算平台,具备自感知、自调度能力,从而自适应处理毫秒级的流量变化,是网络应对AI时代的关键变革。

在此基础上,INT-Based Routing应运而生,推动网络控制面进一步走向智能化,是路由技术的最新范式。可以说,INT-Based Routing 是为AI而生的智能路由!

【更多详细内容,请访问星融元官网 开放网络的先行者和推动者- 星融元Asterfusion 官网】

http://www.xdnf.cn/news/5846.html

相关文章:

  • 《飞飞重逢》手游:暴力治疗与团队赋能的战场艺术!
  • feign.RequestInterceptor 简介-笔记
  • 深入浅出:Java 中的动态类加载与编译技术
  • 2025.5.12 APIO 模拟赛总结
  • 小结: Port Security,DHCP Snooping,IPSG,DAI,
  • python opencv 将不同shape尺寸的图片制作video视频
  • 法国蒙彼利埃大学团队:运用元动力学模拟与马尔可夫状态模型解锁 G 蛋白偶联受体构象动态机制
  • Linux 服务器用 SSH 拉取多个 Git 工程
  • LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署
  • 开发工具分享: Web前端编码常用的在线编译器
  • Matlab 基于滑模自抗扰的高速列车自动驾驶算法研究
  • Linux 软硬连接详解
  • linux下minio的进程管理脚本
  • LMFD格子多相流体力学仿真机:超级计算如何实现平民化?
  • Java高频面试之并发编程-16
  • Mysql的索引,慢查询和数据库表的设计以及乐观锁和悲观锁
  • AUTOSAR图解==>AUTOSAR_TR_GeneralBlueprintsSupplement
  • 知网AI检测对抗智能体,降AI率不再单独花钱!
  • ESP32 web服务导致的lwip “pbuf_free: p->ref > 0问题
  • 【001】renPy android端启动流程分析
  • 内存对齐(Memory Alignment)
  • 4399(简易版) GOC小游戏
  • [python] 面向对象的三大特性-封装及新式类
  • Autoregressive Distillation of Diffusion Transformers
  • IOP|2025第二届机电一体化、机器人与控制系统国际会议(MRCS2025)
  • 电流互感器使用全攻略
  • Hugging Face汉化教程及注册使用详解
  • python-74-Nacos技术之单机模式安装Nacos并使用Python操作Nacos
  • 【Ansible】之inventory主机清单
  • 用 openssl 测试 tls 连接