找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2|回复: 0

【Gemini翻译】 deeplearning.ai - The Batch《数据要点:通义千问发布全新开源旗舰版更新》

[复制链接]

5

主题

0

回帖

17

积分

新手上路

积分
17
发表于 昨天 23:04 | 显示全部楼层 |阅读模式
【Gemini翻译】 deeplearning.ai - The Batch《数据要点:通义千问发布全新开源旗舰版更新》http://t.cn/AXtHanou

在今天的《数据要点》中,您将了解更多关于以下内容的信息:
- OpenClaw 创始人加入 OpenAI
- Gemini DeepThink 刷新科学与推理纪录
- OpenAI 与 Cerebras 合作推出 Codex-Spark
- 好莱坞向字节跳动发送停止侵权函

首先:

**通义千问 3.5 在指令遵循、智能体搜索等方面刷新 SOTA**
阿里巴巴通义千问团队发布了 Qwen3.5-397B-A17B,这是一款原生视觉语言模型,采用了结合 Gated Delta Networks 线性注意力和稀疏混合专家(MoE)的混合架构。该模型在每次前向传播中仅激活 3970 亿总参数中的 170 亿,在保持竞争力的同时优化了推理速度和成本。该模型支持的语言和方言从之前的 119 种扩展到 201 种,其权重已在 Hugging Face 和 ModelScope 上公开。基准测试结果显示,该模型在知识任务、编程、推理和多模态理解方面可与 GPT-4、Claude Opus 4.5 和 Gemini Pro 3 媲美,但在数学竞赛和长文本任务等专业基准测试中仍落后于领先模型。托管版本 Qwen3.5-Plus 通过阿里云百炼(Model Studio)默认提供 100 万 token 的上下文窗口,并内置了工具调用能力。

**GLM-5 重启,助力智能体进行实际的长上下文工作**
Z.ai 发布了 GLM-5,这是一款拥有 7440 亿参数(40B 激活)的模型,专为复杂的系统工程和长程智能体任务设计。该模型从 GLM-4.5 的 355B 参数规模进行了扩大,并集成了 DeepSeek 稀疏注意力机制以降低部署成本。在基准测试中,GLM-5 在推理、编程和智能体任务方面表现出色。在 SWE-bench Verified 等编程基准测试中,GLM-5 的得分为 77.8%,而 GLM-4.7 为 73.8%。GLM-5 的权重根据开源 MIT 协议在 Hugging Face 和 ModelScope 上提供,API 访问可通过 api.z.ai 和 BigModel.cn 获取。

**OpenAI 聘请 OpenClaw 创始人,项目将保持开源**
OpenClaw AI 智能体项目创始人 Peter Steinberger 宣布他将作为员工加入 OpenAI,同时将 OpenClaw 转交给一个独立的基金会以保持开源。Steinberger 表示,他的动机是加速为主流用户开发智能体,而不是将 OpenClaw 建立成一家独立公司。他在领导了上一家创业公司 13 年后,更倾向于开发产品而非扩展组织规模。OpenAI 已承诺赞助 OpenClaw 项目,该项目将作为一个基金会运作,支持多种模型和公司,同时保持社区对数据的所有权。Steinberger 在决定 OpenAI 最符合其愿景之前,花了一周时间与各大 AI 实验室会面并获得了未发布研究的访问权。这一安排允许他在为 OpenAI 的前沿 AI 研究做出贡献的同时,继续将 OpenClaw 作为一个社区驱动的项目而非商业项目来开发。

**谷歌为 API 用户更新 Gemini DeepThink**
谷歌发布了 Gemini 3 Deep Think 的更新版本,这是一种专为科学研究、数学问题解决和工程应用设计的专业推理模式。此次升级在 2025 年国际数学奥林匹克竞赛中获得了金牌水平的表现,并在衡量通用推理能力的 ARC-AGI-2 基准测试中达到 84.6%。它还在物理和化学领域展示了精通度,在 2025 年国际物理和化学奥林匹克竞赛中均达到金牌水平。更新后的 Deep Think 已在 Gemini 应用中向 Google AI Ultra 订阅者开放,并首次通过早期访问计划面向研究人员、工程师和企业通过 Gemini API 开放。实际应用包括将草图转换为可 3D 打印的模型,以及帮助研究人员解释复杂数据集,将 Deep Think 的效用从抽象推理扩展到了生产工程工作流中。

**OpenAI 缩小 Codex 规模并更换芯片以实现更快的编程**
OpenAI 发布了 GPT-5.3-Codex-Spark,这是 GPT-5.3-Codex 的一个更小、更快的版本,专为实时编程协作而优化。该模型在 Cerebras 的 Wafer Scale Engine 3 硬件上每秒可交付超过 1000 个 token,并具有 128k 的上下文窗口。它作为研究预览版在 Codex、CLI 和 VS Code 扩展中面向 ChatGPT Pro 用户推出,并为设计合作伙伴提供有限的 API 访问。该模型在预览期间仅支持文本,并受独立的速率限制约束;OpenAI 计划根据开发者的反馈扩大访问范围并增加功能,如更大的模型、更长的上下文和多模态输入。

**Seedance 2.0 引发好莱坞制片厂及其他机构的知识产权批评**
字节跳动发布了 Seedance 2.0,这是一款在中国推出的 AI 视频生成器,可根据文本提示创建高质量视频,随即引发了主要好莱坞机构的强烈谴责。美国电影协会(MPA)、演员工会-美国电视和广播艺人联合会(SAG-AFTRA)以及编剧们认为,该工具是在未经授权的情况下使用受版权保护的材料进行训练的,并且在未经许可的情况下使用演员的肖像和声音生成视频。MPA 主席呼吁字节跳动“立即停止其侵权活动”,而 SAG-AFTRA 表示该工具“无视法律、道德、行业标准和基本的许可原则”。编剧 Rhett Rheese 在观看了一个包含汤姆·克鲁斯和布拉德·皮特 AI 生成版本的 Seedance 2.0 演示后,对创意专业人士的前景表示悲观。字节跳动回应称其尊重知识产权,并正在“采取措施加强当前的保障措施”,但未提供关于重新训练模型或实施许可机制的具体细节。

**想了解更多关于目前 AI 领域的重要动态吗?**
阅读最新一期的《The Batch》以获取有关新闻和研究的深入分析。

上周,吴恩达谈到了他在圣丹斯电影节的经历,在那里他与好莱坞专业人士交流,以解决他们对 AI 的担忧,强调了文化差异以及该行业对 AI 对就业和知识产权影响的忧虑。
“好莱坞有很多理由对 AI 感到不安。娱乐界的人士与许多科技界人士有着截然不同的文化,这导致了我们在关注重点和价值观上的深层差异。”
点击此处阅读吴恩达的信件。

其他深入报道的顶级 AI 新闻和研究故事:
- SpaceX 收购了 xAI 并宣布了在太空建立数据中心的计划,标志着 AI 基础设施的新前沿。
- Anthropic 更新了其旗舰模型 Claude Opus 4.6,该模型通过解决更复杂的问题在情报指数中位列第一。
- OpenAI 校友创立了 Averi,旨在为 AI 模型审计设定标准,目标是实现更一致、更可靠的评估实践。
- 研究人员介绍了 Dr. Cabot,这是一款经过训练用于诊断复杂病症的智能体,有望提供更强大的医疗诊断。

**社区特别优惠**
DeepLearning.AI 最近推出了首个针对我们整个课程目录的订阅计划!作为 Pro 会员,您将立即获得:
- 来自吴恩达和行业专家的超过 150 门 AI 课程和专项课程
- 用于测试知识的实验和测验
- 可与雇主分享的项目
- 证明您新技能的证书
- 帮助您以 AI 速度进步的社区
现在报名即可锁定全年访问权限,每月只需 25 美元(预付),或者选择每月支付 30 美元的按月支付方案。两种支付方式均包含一周的免费试用。探索 Pro 的福利并从今天开始构建!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-2-19 11:12 , Processed in 0.101975 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表