找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1|回复: 0

🚨 Qwen3.5 开源:原生多模态,极致高效率!

[复制链接]

4

主题

0

回帖

12

积分

新手上路

积分
12
发表于 3 小时前 | 显示全部楼层 |阅读模式
🚨 Qwen3.5 开源:原生多模态,极致高效率!


阿里在除夕夜发布了 Qwen3.5 系列的首个开源模型 Qwen3.5-397B-A17B。该模型性能媲美全球顶级闭源模型,实现模型架构的全面革新。此次发布的版本总参数为3970亿,激活仅170亿,部署显存占用降低60%,推理效率大幅提升,最大吞吐量可提升至19倍。

模型采用原生多模态设计,通过早期融合方式在视觉和文本混合数据上大规模预训练,大幅新增中英文、多语言、STEM和推理等数据,在推理、编程、Agent智能体等全方位基准评估中均表现优异。

视觉能力在 MathVision、RealWorldQA、CC_OCR、RefCOCO 等基准上取得领先成绩,比之前的 Qwen3-VL 在空间定位、带图推理和学科解题任务中表现更好。它支持 1M token 上下文长度,能直接处理长达 2 小时的视频输入,而且视觉和代码能力融合,支持从手绘草图生成前端代码。

Transformer 架构上融入了获2025 NeurIPS最佳论文的自研门控技术,结合线性注意力机制与高稀疏度MoE架构,实现了397B总参数激活仅17B的极致模型效率。通过训练稳定性优化与多token预测等技术,在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

语言支持从 Qwen3 系列的 119 种扩展到 201 种,词表扩大到 250K,小语种编码效率最高提升 60%。在推理、编程、Agent 任务上表现突出。Agent 方面支持移动端主流 APP 操作和 PC 端复杂多步骤任务,还构建了异步强化学习框架,端到端加速 3 到 5 倍,插件支持可扩展到百万级规模。

现在可以在 Qwen Chat、千问 APP 和 PC 端免费体验。模型权重已在 Hugging Face 和魔搭社区开源,阿里云百炼提供 API 服务,百万 token 最低 0.8 元。后续系列模型预计陆续开源。















本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-24 14:51 , Processed in 0.462273 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表