找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2|回复: 0

英伟达刚刚发布LPU

[复制链接]

6

主题

1

回帖

20

积分

新手上路

积分
20
发表于 昨天 10:16 | 显示全部楼层 |阅读模式
英伟达刚刚发布LPU

英伟达的新武器:LPU推理芯片

去年12月,英伟达花200亿美元把Groq收了,看中的就是他们的LPU(Language Processing Unit)技术。

核心价值:
GPU擅长训练,但推理有瓶颈(延迟高、能耗大)
LPU专门优化推理流水线,和GPU配合干活
解决了"低延迟"和"高吞吐"不能兼得的老问题
NVIDIA Groq 3 LPX的硬指标:
每兆瓦推理吞吐量提升35倍
万亿参数模型营收潜力提升10倍
256个LPU处理器/机架
128GB片上SRAM + 640TB/s带宽
全液冷设计,无缝集成到Vera Rubin AI工厂

工作原理:
LPU和Vera Rubin GPU协同计算,每一层每个token都一起算,大幅提升解码性能。多个LPU可以像一个巨型处理器一样工作,实现确定性推理加速。

适用场景:
万亿参数模型 + 百万token上下文。这是之前GPU单打独斗做不到的。

产能:
目前三星代工,下一代可能转台积电。未来GPU(Feynman架构)可能直接整合Groq处理器。

上市时间:今年下半年。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-19 08:08 , Processed in 0.261187 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表