header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

英伟达推出首款Groq芯片LPX:与Vera Rubin组合每兆瓦推理效率最高提升35倍,并展示下一代Kyber原型

1M AI News 监测,Groq 3 LPU(语言处理单元)是英伟达去年 12 月以约 200 亿美元收购 AI 推理芯片初创公司 Groq 后推出的第一款芯片,预计今年第三季度开始出货。Groq 3 LPX 机架可容纳 256 颗 LPU,配备 128GB 片上 SRAM 和每秒 640TB 的扩展互连带宽。官方称 LPX 与 Vera Rubin NVL72 搭配部署时,每兆瓦推理吞吐量最高可提升 35 倍,同时解锁万亿参数、百万令牌上下文推理场景的营收潜力。黄仁勋将两款处理器描述为"极端差异却相互统一:一个追求高吞吐,一个追求低延迟",LPX 的片上内存则大幅扩展模型可用的总内存容量。LPX 机架计划今年下半年随 Vera Rubin 平台一同上市。

大会上,黄仁勋还展示了代号 Kyber 的下一代机架架构原型。Kyber 将 144 颗 GPU 的计算托盘改为垂直排列,以提升物理密度、降低延迟,将搭载于 Vera Rubin 的继任平台 Vera Rubin Ultra,预计 2027 年推出。

举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成