10月14日消息,NVIDIA宣布,Meta、Oracle(甲骨文)两大巨头将升级AI数据中心网络,采用NVIDIA Spectrum-X以太网网卡和交换机。
其中,Meta将把Spectrum-X以太网交换机集成到Facebook开放交换系统(FBOSS)网络基础设施中,一款专为管理和控制大规模网络交换机而开发的软件平台。
二者结合,将加快大规模部署,提升AI训练效率,缩短获取洞察的时间。
Oracle将构建基于NVIDIA Vera Rubin架构提供加速、通过Spectrum-X以太网进行互连的“十亿瓦级”(Giga-Scale) AI工厂。
Vera、Rubin分别是NVIDIA的下一代AI CPU、GPU,去年年中官宣,目前已在台积电完成流片。
其中,Rubin将采用台积电3nm EUV工艺制造,首款产品R100,搭配下一代HBM4高带宽内存,明年发布,后年还有升级版Rubin Ultra。
Spectrum-X以太网平台也是NVIDIA AI全栈平台的关键部分,专为万亿参数模型打造,是业界首个专为AI打造的以太网网络平台,包括Spectrum-X以太网交换机、Spectrum-X SuperNIC以太网网卡,可连接数百万颗GPU。
NVIDIA宣称,Spectrum-X已经展现出创纪录的效率、先进的拥塞控制技术,助力全球最大的AI超级计算机实现了95%的数据吞吐量,而在通用的以太网规模部署中,会出现不计其数的流量冲突,导致吞吐量降低至大约60%。
同样属于下一代平台的CX9 SuperNIC也已完成流片,将升级1600Gbps带宽,也就是160万兆。
黄仁勋表示:“万亿参数模型正在将数据中心转变为十亿瓦级AI工厂。Spectrum-X不仅是更快的以太网,更是AI工厂的神经系统,帮助超大规模企业将数百万个GPU连接到一起,构建巨型计算机,从而训练有史以来规模最大的模型。”
本文转载于快科技,文中观点仅代表作者个人看法,本站只做信息存储
显示全部
收起
本站部分文章来自网络或用户投稿,仅供信息存储。阅读前请先查看【免责声明】,若本文侵犯了原著者的合法权益,可联系我们进行处理。本文链接:https://m.trustany.com/intel/12205.html