IT之家 5 月 25 日音书,2025 年 5 月 23 日,在鲲鹏昇腾配置者大会 2025 —— 昇腾 AI 配置者峰会上,华为推出了昇腾超节点时刻,顺利完竣业界最大领域的 384 卡高速总线互联。
刻下,大模子发展呈现参数与恶果轮换演进的态势:一方面,Scaling Law 不休鼓舞模子才气突破极限;另一方面,以 DeepSeek 为代表的编削架构与工程时刻,正加快模子才气在千行万业的落地欺诈。在此配景下,MoE 成为主流模子结构,其复杂的夹杂并行政策带来浩瀚挑战,TP、SP、EP 单次通讯量高达 GB 级且难以粉饰。跟着并行领域握续扩大,传统管事器跨机带宽已成为锻真金不怕火的中枢不容,亟需诡计架构的编削升级以适配改日模子发展。
传统管事器依赖以太网罗完竣跨机互联,通讯带宽较低。现实标明,当 TP、SP 或 EP 等散布式政策的夹杂并行域特等 8 卡时,跨机通讯带宽便成为性能瓶颈,导致系统性能大幅着落。
据先容,华为昇腾超节点冲突了以 CPU 为中心的冯诺依曼架构,编削提议了平等诡计架构,凭借高速总线互联时刻完竣首要突破,把总线从管事器里面,彭胀到整机柜、甚而跨机柜。在超节点范围内,用高速总线互联替代传统以太,通讯带宽普及了 15 倍;单跳通讯时延也从 2 微秒作念到 200 纳秒,裁汰了 10 倍,使集群如团结台诡计机般协同职责,有用突破系统性能限度。
IT之家从华为中国官方获悉,这次推出的昇腾 384 超节点,由 12 个诡计柜和 4 个总线柜组成,是现在业界领域最大的超节点。依托华为在 ICT 领域深厚的时刻与工程教诲,通过最好负载平衡组网决议,该超节点可进一步彭胀为包含数万卡的 Atlas 900 SuperCluster 超节点集群,为改日更大领域的模子演进提供守旧。
性能测试数据泄露开云体育(中国)官方网站,在昇腾超节点集群上,LLaMA 3 等千亿茁壮模子性能比拟传统集群普及 2.5 倍以上;在通讯需求更高的 Qwen、DeepSeek 等多模态、MoE 模子上,性能普及可达 3 倍以上,较业界其他集群逾越 1.2 倍,在行业中处于率先地位。