2025年UPN512技术架构白皮书v1.0【2025年10月】.pdfVIP

2025年UPN512技术架构白皮书v1.0【2025年10月】.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

UPN512技术架构白皮v1.0

阿里云智能集团网络研发

1/26

目录

1.术语

2.AI基础设施网络的发展趋势

3.xPUScaleup网络的演进和挑战

4.阿里云UPN512架构概览

5.UPN512系统设计和关键组件

5.1系统架构

5.1.1AIRack-铜互连紧耦合系统

5.1.2UPN512-单层光互连解耦系统

全光互连

单层千卡域

解耦设计

5.2光互连概览

5.2.1可插拔光互连⽅案

5.2.2⾼密带宽光互连⽅案

5.2.3LPO/NPO场景和⽅案的选择

5.2.4LPO/NPO成本

5.2.5互连稳定性

5.3传输语义

5.4在⽹计算

2/26

1.术语

术语解释

UPNUltraPerformanceNetwork

HPNHighPerformanceNetwork

MoEMixtureofExperts

EPExpertParallelism

FROFullyRetimedOptics

LPOLinear-drivePluggableOptics

NPONear-packagedOptics

CPOCo-packagedOptics

OEOpticalEngine

VCSELVertical-CavitySurface-EmittingLaser

EMLElectro-AbsorptionModulatedLaser

ELSFPExternalLaserSmallForm-FactorPluggable

MTBFMeanTimeBetweenFailures

MTTRMeanTimeToRepair

2.AI基础设施网络的发展趋势

近年来,随着人工智能(AI)技术蓬勃发展,大模型训练、推理任务对算力、内存的需求呈现

指数级增长。为了提升算力,获取更短的训练时间和更高的推理效率,智算集群通过高性能网

络进行集群算力的扩展,目前已经从万卡向十万卡、数十万卡级别迈进。为了实现高效的训练

推理,业界通常会采用多种并行策略驱动数千甚至数万张xPU进行交换数据,协作完成作业,

3/26

这依赖于高性能的网络转发能力。纵观AI基础设施的技术发展,如下几个方面对网络提出新的

要求。

模型结构从Dense演进到MoE。大模型经过其初期发展后,在提升模型容量效率和降低计算成

本的驱动下,基于MoE(MixtureofExperts)的模型结构逐渐代替Dense模型结构,成为一

种趋势。MoE将模型划分为多个独立专家网络,并利用门控机制动态分配输入数据给特定专家

进行处理。MOE通过多个专家并行处理不同的数据子集,然后根据输入数据的特征动态选择

最合适的专家输出,在提高模型性能的同时有效地控制了算力成本。从网络视角,MoE模型结

构通常采用EP并行(ExpertParallelism),EP并行要求网络超大带宽和超低时延

文档评论(0)

经济咨询专家 + 关注
实名认证
服务提供商

熟悉行业的发展与商业发展,行业咨询与交流。

1亿VIP精品文档

相关文档