示指哥 发表于 2026-2-12 11:51:00

智谱AI正式发布GLM-5大模型,参数规模从355亿扩展到744亿,预训练数据量增至28.5万亿token。

智谱AI正式发布GLM-5大模型,参数规模从355亿扩展到744亿,预训练数据量增至28.5万亿token。该模型集成了DeepSeek稀疏注意力机制,在保持长文本处理能力的同时降低部署成本。GLM-5在编程任务性能上提升20%,能完整完成项目开发全流程,接近ClaudeOpus4.5水平。


在VendingBench2测试中,GLM-5模拟经营自动售货机一年获得4432美元收益,展现强大的长期规划能力。模型已开源并支持商用,可在Z.ai平台免费体验。GLM-5标志着AI从聊天工具向实际工作伙伴的转变,特别适合程序员、创业者和内容创作者使用。

技术细节:他们做对了什么?
如果你对技术感兴趣,这里有几个值得关注的点:
稀疏注意力机制

:GLM-5 集成了 DeepSeek 稀疏注意力机制,在降低部署成本的同时保持了长文本处理能力 Futu News。通俗点说,就是"省钱又好用"。

强化学习基础设施 "slime"

:他们开发了一套新的训练系统,能更高效地让模型"学习"——这是为什么 GLM-5 能在推理、编码、智能体任务上表现这么好的原因之一。

开源 + 商用友好

:模型权重以 MIT 许可证发布,意味着你可以免费用,甚至可以商用。这在国内大模型里算是比较良心的。#人工智能##智谱清言##GLM-5#














页: [1]
查看完整版本: 智谱AI正式发布GLM-5大模型,参数规模从355亿扩展到744亿,预训练数据量增至28.5万亿token。