智谱AI正式发布GLM-5大模型，参数规模从355亿扩展到744亿，预训练数据量增至28.5万亿token。

示指哥 发表于 2026-2-12 11:51:00

智谱AI正式发布GLM-5大模型，参数规模从355亿扩展到744亿，预训练数据量增至28.5万亿token。

智谱AI正式发布GLM-5大模型，参数规模从355亿扩展到744亿，预训练数据量增至28.5万亿token。该模型集成了DeepSeek稀疏注意力机制，在保持长文本处理能力的同时降低部署成本。GLM-5在编程任务性能上提升20%，能完整完成项目开发全流程，接近ClaudeOpus4.5水平。

在VendingBench2测试中，GLM-5模拟经营自动售货机一年获得4432美元收益，展现强大的长期规划能力。模型已开源并支持商用，可在Z.ai平台免费体验。GLM-5标志着AI从聊天工具向实际工作伙伴的转变，特别适合程序员、创业者和内容创作者使用。

技术细节:他们做对了什么?
如果你对技术感兴趣,这里有几个值得关注的点:
稀疏注意力机制

:GLM-5 集成了 DeepSeek 稀疏注意力机制,在降低部署成本的同时保持了长文本处理能力 Futu News。通俗点说,就是"省钱又好用"。

强化学习基础设施 "slime"

:他们开发了一套新的训练系统,能更高效地让模型"学习"——这是为什么 GLM-5 能在推理、编码、智能体任务上表现这么好的原因之一。

开源 + 商用友好

:模型权重以 MIT 许可证发布,意味着你可以免费用,甚至可以商用。这在国内大模型里算是比较良心的。#人工智能##智谱清言##GLM-5#

页: [1]

一起港湾's Archiver

智谱AI正式发布GLM-5大模型，参数规模从355亿扩展到744亿，预训练数据量增至28.5万亿token。