找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 4|回复: 0

NVIDIA DGX Spark支持4台集群组网 性能线性飙升

[复制链接]

11

主题

0

回帖

43

积分

新手上路

积分
43
发表于 昨天 12:04 | 显示全部楼层 |阅读模式
NVIDIA DGX Spark支持4台集群组网 性能线性飙升


NVIDIA 宣布,DGX Spark迎来全新功能,现已支持最多4台设备集群组网,从而搭建紧凑型的“桌面数据中心”。被大家昵称“小金盒”的DGX Spark单台具备1千万亿次每秒的AI算力,搭配128GB LPDDR5X统一内存,四台并行就具备4千万亿次的算力和512GB统一内存。

DGX Spark现已支持多种运行拓扑结构,都依托ConnectX-7网卡提供的低延迟RoCE通信,针对不同目标做了专门优化:

* 单节点:适合低延迟、大上下文长度推理,可推理最高2000亿参数模型、微调最高1200亿参数模型,以及本地智能体类工作负载。

* 双节点:均衡扩展,可更快完成微调、支持更大模型,可支撑最高4000亿参数模型的推理。

* 三节点(环形拓扑):适合更大模型微调或小型训练任务。

* 四节点(搭配RoCE 200GbE交换机):可作为本地推理服务器,完美支持最高7000亿参数的前沿大模型、通信密集型工作负载,以及本地AI工厂运营。

NVIDIA号称,DGX Spark多台并行,可以实现接近线性的性能扩展提升,而且不需要像传统机架式服务器部署那样的复杂配置。

比如Isaac Lab强化学习性能,单节点性能630FPS,双节点翻番至1241FPS,四节点再次翻番至2520FPS,而延迟基本不变。

再比如Nanochat微调的性能,单节点Token输出速度为每秒约1.84万,双节点翻番至3.59万,四节点再次翻番至7.46万。

同时,NVIDIA还推出了全新的NVIDIA NemoClaw开源技术栈,DGX Spark可提供全栈平台,支持在本地构建、运行长期自主运行的AI智能体,后续也能无缝扩展至AI工厂等数据中心基础设施。

此外,DGX Spark还即将迎来新的软件版本,可进一步提升编排与管理能力,加速从原型到生产的迭代。

目前,金融、医疗、能源、通信等众多行业机构均已部署DGX Spark。

http://t.cn/AXfbdcDx








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-20 09:16 , Processed in 0.151168 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表