(2026.3.6)OpenAI 推出 GPT-5 系列重磅更新 GPT-5.4,官方定位「目前最强、最高效专业工作模型」,也是首个原生具备电脑操控能力的通用大模型,AI自主代理时代再进一步!
一、核心突破:AI 真的会用电脑了
• 看懂屏幕界面、写代码、直接键鼠操作电脑
• OSWorld 桌面操控测试成功率 75%
• 超过人类平均水平(72.4%),远超前代 GPT-5.2(47.3%)
二、三大版本,分工明确
• GPT-5.4:标准版,均衡全能
• GPT-5.4 Thinking:强推理+可展示思考过程,支持中途干预
• GPT-5.4 Pro:性能拉满,面向顶级专业场景
三、能力全面暴涨
• 44 种职业 GDPval 基准:83% 打平/胜过专业人士
• 投行建模评分:68.4% → 87.3%
• 整合 Codex 编程能力,SWE-Bench Pro 57.7%
• 工具搜索优化,token 消耗直降 47%
• API 支持 100万 tokens 超长上下文
四、多项基准吊打竞品
领先 Claude Opus 4.6、Gemini 3.1 Pro 等:
• 电脑操控:75.0%>72.7%
• 网页浏览:67.3%>66.4%
• 专业任务:83.0%>78.0%
• 代理浏览、软件工程、高级数学等全面领先
五、上线与价格
• ChatGPT Plus/Pro/Team 已逐步推送
• GPT-5.2 Thinking 将于 2026.6.5 退役
• API 输入:$2.5/百万token;输出:$15/百万token
• 已登陆 ChatGPT、OpenAI API、Codex 平台
Altman:我们把 PhD 级专家放进每个人口袋,现在,让他们亲手操作世界。
- GPT-5.4 已在 ChatGPT、OpenAI API 和 Codex 平台陆续上线,开发者与专业用户可立即体验。
#GPT5###