问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

见证AI 的变革时刻:高速光模块,以太网交换机和液冷技术

发布网友 发布时间:2024-10-05 06:36

我来回答

1个回答

热心网友 时间:2024-10-24 01:36

英伟达GTC 2024大会发布了GB200芯片及配套架构,通过提升GPU互联带宽、采用高性能光模块和交换机,并部署液冷技术,推动AI计算效能与数据中心能效升级。

在英伟达 GTC 2024 大会上,黄仁勋发表“见证 AI 的变革时刻”演讲,并推出了GB200芯片及相关架构,通过大幅提升GPU间的互联带宽并采用1.6T光模块。同时发布全球首批端到端800G吞吐量的InfiniBand和以太网交换机,以及采用液冷技术的服务器解决方案,全方位推动AI计算性能革新和数据中心能效提升。

1 高速光模块

在GTC 大会上,英伟达揭晓了新一代 GB200 芯片,业界正密切关注这款芯片如何重塑光模块市场需求格局。

在去年五月末的 COMPUTEX 展会上,英伟达首度公开其 GH200 芯片。经估算,在由256颗GH200构建的集群配置中,所需的800G光模块数量高达2304个,平均每颗芯片配备的光模块比例达到了空前的1:9。

本次发布会上崭露头角的GB200同样秉持了这一设计理念,依据黄仁勋在演讲中的披露,单个GPU之间的双向通信带宽已经由先前的900GB/s跃升至1800GB/s。而在集群配置上,一个标准机柜能装载上限为72颗BlackwellGPU,借助新一代NVLink5交换技术,可以实现多达576颗GPU的互联;并且通过InfiniBand或以太网交换机,集群规模还可进一步扩容至上万个GPU节点。

该方案在单台机架中配置了 36 颗 GRACE CPU 和 72 颗 Blackwell GPU,通过铜缆的方案将该 72 颗 Blackwell GPU 进行互联,这一点与 GH200 方案类似,即:第一层网络无需光模块互联。

正如黄仁勋主题演讲所揭示,在GB200的单机柜配置中,得益于全新一代NVLink Switch芯片的支持,GB200能够组建一个由576颗Blackwell GPU构成的计算集群,显著超越了前代GH200所支持的最大256颗GPU集群规模。

就互联带宽而言,集群内的每一颗Blackwell GPU都能实现双向1800GB/s的高速传输,相较于GH200,带宽性能整整翻了一番,这也意味着对应的光模块需承载的带宽加倍,从而催生了对1.6T光模块的需求。

下面我们参照上述逻辑进行估算:

据此推算得出,在GB200芯片与1.6T光模块之间,它们的理想使用比例同样是576:5184=1:9,即单个芯片数与光模块的比例为1:9。

2 以太网交换机

英伟达隆重推出了Quantum-X800 InfiniBand系列与Spectrum-X800以太网交换机产品,成为全球率先实现全程800GB/s数据传输速率的网络解决方案,携手英伟达的配套软件套件,能够有力地促进各种类型数据中心内人工智能任务、云端运算、大数据处理以及高性能计算应用的执行效率,此创新同样适用于基于Blackwell架构新近构建的数据中心环境。

英伟达 Quantum-X800 和 Spectrum-X800 交换机

两者的早期应用客户有微软Azure、甲骨文云基础设施和 CoreWeave。其中 Quantum-X800 相比上一代,使用 SHARPv4下的带宽容量提高 5 倍、网络计算能力增加 9 倍至 14.4TFlops。Spectrum-X800 优化网络性能,转为多租户环境设计,可确保每个租户的 AI 工作负载的性能隔离,以保持最佳且一致的性能水平,从而提高客户满意度和服务质量。

在国内,新华三与华为两大企业紧随交换机技术升级的步伐,相继推出了自家的800G数据中心交换机产品。如新华三在NAVIGATE领航者峰会上全球首度推出了旗下51.2Tbps速率的800G CPO硅光数据中心交换机系列产品——H3C S9827系列。

图:新华三全球首发 800G CPO 硅光数据中心交换机

这款产品内置的单芯片传输速率高达51.2T级别,支持64个800G的端口。在保证高吞吐性能的同时,借由CPO硅光技术的优势,进一步将单端口传输延迟降低了20%,这一改进意味着在同样的时间周期内,AIGC集群内部GPU之间的数据交换能力可以得到25%的增长,显著提升了GPU的整体计算效能。

一样,华为在 2023 年 6 月第 31 届中国国际信息通信展中发布首款 800GE 数据中心核心交换机——CloudEngine 16800-X 系列:

图:华为首发 CloudEngine 16800-X 800GE 数据中心交换机

华为声称其CloudEngine 16800-X支持 288 个 800GE 端口,具备3.5 微秒跨板转发时延,整体TCO可降低 36%。

3 液冷技术

在英伟达 GB200 的方案中,其机架具有 2 英里长的 NVLink 布线,共 5000 根电缆,估算其功耗将达 20KW及以上。因此,服务器亟需更高效的散热方式。为了让这些计算快速运行,英伟达将采用液冷的设计方案,冷却液输入/输出水温分别为 25℃/45℃。

除了英伟达,AI 服务器厂商超微电脑预计将在24Q2内扩产液冷机架。

GB200 NVL72 液冷机架示意图

同时,国内产业链也在协同推进液冷技术的发展。三大运营商在去年 6 月发布了《电信运营商液冷技术*》,并提出 25 年及以后液冷在 50%以上项目规模应用的愿景。

电信运营商液冷技术规划
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
苹果手机微信怎么换漂亮字体(苹果手机微信怎么换行输入) 有什么好用的app转换字体 手写转文字的软件 erp可以看评论地址吗 淘宝评论url是什么意思? 揭秘:码牌支付风控升级,背后真相揭秘 电脑电视直播软件哪个好用什么软件好电脑看电视直播 潼南子同街学区是哪些 三极管BU406价格和参数? 火锅料放在冰柜忘了插电一个星期给会坏了吗 火锅的设备有哪些 页岩砖是不是烧结煤矸石普通砖? 页岩砖和普通烧结砖的区别是什么 系统突然桌面背景变为黑色,右下角显示我的系统不是正版系统,装机小 谁能把包含''米''这个部首的字全部列出来?大家费心了?? 画圈的字到底怎么读的 画圈的这个字怎么读? 如何追喜欢星座运理且是射手座的姑娘? 画圈的字怎么读啊? 问下这个画圈的词怎么读,是啥意思啊?我没有字典〒_〒 画圈的字的读音,谢谢。 请问画圈的字读什么?帮帮忙 画圈的字 读什么 怎么拼 《荒野行动》换区方法介绍介绍_《荒野行动》换区方法介绍是什么_百度知 ... 荒野行动PC版卡在未选择服务器 无法选择服务器 文言文咸是什么意思? 中远海运集装箱:类型、价格以及如何跟踪 天津有什么海运公司 芬兰的那个城市可以看到极光,芬兰极光夏天推荐旅游路线 全国旅游一卡通是真的吗,能用吗,多少钱一张,哪里有卖,江西、福建的有吗... 文件号的括号应该如何正确的书写? 如何判断芝麻糊的品质? 400G全场景光模块白皮书 别人欠我钱!他好像忘记了!怎么办?不好意思说啊! 别人借了你的钱,但他忘了,你应该怎么提醒他? 故意伤害罪非法持有枪支弹药罪会判几年呢 驾照被吊销了怎么补办 难道男朋友家是后妈就真的嫁不得吗? 打击“卖惨式”带货,封禁10个百万粉丝主播,如何识别卖惨主播行为?_百度... 大匠运斤什么意思大匠运斤怎么读 快手为什么被封了 4位爆火后迅速消失的千万网红,有人被直接封杀,有人在苦苦挣扎 库欣综合征怎么治疗 促肾上腺皮质激素和皮质醇增高是什么原因 各品牌路由器登录网址大全[路由器的用户名和密码] 38妇女节祝福的话语 走心的妇女节文案有哪些 38妇女节女神节祝福高级走心文案来啦,好燃!好爱! 朋友圈妇女节走心文案(妇女节公众号文案) 叮咚!高级走心的三八妇女节文案素材+精选海报已上线~ 字谜:一人工作不认真。猜一字(解答) 三八妇女节简短优美祝福语 三八妇女节唯美句子