他们用AI训练出一个写GPU底层代码的程序员。这哥们写的代码,比目前最好的编译器快两倍,比Claude和Gemini强40%。
为什么这事值得关注?因为GPU太贵了,而决定它跑多快的,是一种叫CUDA Kernel的底层代码。这代码极难写,全球能写好的没几个,英伟达养了一支专家团队打磨了几十年。
字节怎么做的?三步:让AI自己写代码,扔到真实GPU上跑测速度,跑得快就奖励,跑得慢就惩罚。全程没人教它怎么写,全靠结果反馈自学。几周时间,从一个不如编译器的菜鸟,变成了碾压所有对手的高手。
最狠的是,这意味着同样的GPU,用更好的AI代码,性能能翻倍。英伟达“想快就买更贵的卡”的逻辑,被软件撬动了一角。
这还只是开始——AI开始自己写代码优化自己运行的基础设施,接下来会发生什么,没人知道。
##