找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 3|回复: 0

Taalas引发争议:AI的端侧时代开启?最近在硅谷和华尔街,都在传一个数字:17,000。

[复制链接]

5

主题

0

回帖

25

积分

新手上路

积分
25
发表于 昨天 21:20 | 显示全部楼层 |阅读模式
Taalas引发争议:AI的端侧时代开启?最近在硅谷和华尔街,都在传一个数字:17,000。


不是道指、纳指,而是 Taalas 这家公司的芯片速度(基于Llama 3.18B):

每秒 1.7 万个 Token。

比 NVIDIA 的主流方案快了接近 10 倍。 比已经很快的专用芯片 Groq 还要快 17 倍 以上。

而且不需要昂贵的HBM、以及高性能散热组件,成本只有 GPU 的几十分之一。

这很可能意味着,AI 迎来了一个全新的分水岭:端侧商业化普及。

Taalas是怎么实现的呢?

其采用了两个原则:

1、全面专业化:为每个独立模型定制最优化硅芯片;

2.、融合存储与计算:冯诺伊曼结构中,存储和计算分离,就导致二者之间数据交换存在隔阂;AI时代,这种隔阂限制了AI推理发挥。

Taalas则重新设计,基于存储与计算的融合和模型定制化,从底层重新设计硬件堆栈。

比如这一次就是把 Llama 3.18B大模型,直接“刻”在了硅片里。

这样做优势和劣处都很明显。

硬件和模型完全定制,不支持其他模型,甚至模型更新后也不一定能良好兼容。

那不是白费了吗?海外对Taalas的做法也很有争议。

我觉得有两个点:

1、对于场景清晰、需求明确、且 模型已经标准化/ 收敛路径清晰, 那Taalas的方案可以大幅降低成本,从而推动AI普及。

例如一些智能家居、AI小硬件产品。

2、Taalas在打造芯片定制设计平台,希望能实现快速、低成本的模型适配。

总体而言,NVIDIA 让 AI 变聪明了。而 Taalas 们,正在让 AI 变廉价。
价格是 AI 走进千家万户的关键。未来也是 端+云的配合。

Taalas的消息意味着,端侧AI、边缘计算又有了新催化。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-24 07:22 , Processed in 0.106999 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表