Taalas把llama3.1 build到chip上达到 17000 tokens/s (H200是230)引发轩然大波

Taalas把llama3.1 build到chip上达到 17000 tokens/s (H200是230)引发轩然大波,这和asic跑路由和mac表有啥区别,所以这波做AI的大伙对原来的技术逻辑都一点不看吗。。。 ​​​
分类