找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2|回复: 0

开源模型追上闭源了?恐怕没这么简单

[复制链接]

3

主题

0

回帖

9

积分

新手上路

积分
9
发表于 昨天 20:38 | 显示全部楼层 |阅读模式

【开源模型追上闭源了?恐怕没这么简单】


Artificial Analysis 最新图表显示,GLM-5 与 Claude Opus 4.6 的差距已缩小到历史最低点。开源社区一片欢腾,但真相远比图表复杂。

先说结论:跑分在收敛,体验在分化。

跑分榜上,开源模型确实在逼近闭源。但换到 SWE-Rebench 这种实战编码测试,Opus 4.6 排第二,GLM-5 排第十四。差距是真实的。一位长期使用两类模型的开发者说得直白:GLM-5 和 Kimi K2.5 大概接近 Sonnet 4.5 的水平,离 Opus 4.6 还差得远。看看 Opus 的推理 token 效率,看看它适应对话的速度,差距一目了然。

但这不意味着开源没有价值。恰恰相反,对于 70% 到 80% 的生产任务,分类、摘要、翻译、数据提取,开源模型的表现与闭源几乎没有区别。真正拉开差距的是那 10% 到 20% 的硬骨头:复杂的多步推理、需要架构决策的代码生成、细微差别决定成败的分析任务。

两年前你只能选 GPT-4,现在你有五六个真正能打的选项。竞争正在压低价格,打破锁定。这才是开源追赶带来的最大红利。

跑分趋同是事实,但跑分不是全部。模型好不好用,最终还是要看它能不能在你的真实任务里稳定输出。

#智谱##Claude#

reddit.com/r/LocalLLaMA/comments/1r44fzk/the_gap_between_openweight_and_proprietary_model






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-16 07:22 , Processed in 0.087578 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表