逐梦之旅 发表于 2026-3-26 11:43:18

马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%

马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%

这里面神奇的是小米的MiMo V2 Pro,70%,全球第三[流汗] ​​​

页: [1]
查看完整版本: 马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%