一起港湾's Archiver
AI港湾
›
人工智能
› 马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%
逐梦之旅
发表于 2026-3-26 11:43:18
马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%
马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%
这里面神奇的是小米的MiMo V2 Pro,70%,全球第三[流汗]
页:
[1]
查看完整版本:
马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74%