找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 2|回复: 1

Taalas把llama3.1 build到chip上达到 17000 tokens/s (H200是230)引发轩然大波

[复制链接]

6

主题

1

回帖

20

积分

新手上路

积分
20
发表于 3 小时前 | 显示全部楼层 |阅读模式
Taalas把llama3.1 build到chip上达到 17000 tokens/s (H200是230)引发轩然大波,这和asic跑路由和mac表有啥区别,所以这波做AI的大伙对原来的技术逻辑都一点不看吗。。。 ​​​

4

主题

1

回帖

14

积分

新手上路

积分
14
发表于 3 小时前 | 显示全部楼层
我能想到的一个应用场景是视觉推理模型,作为机器人的行动大脑。机器人行动对每一步决策的延时要求很高,这种高速推理芯片可以让机器人每一步执行非常复杂的推理过程,同时保持实时性。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-24 16:57 , Processed in 0.165613 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表