Anthropic发布史上最强Sonnet:Claude Sonnet 4.6
#anthropic推出最新ai模型#
Anthropic发布史上最强Sonnet:Claude Sonnet 4.6,只需要一半多一点的价格,就能得到超大杯Opus的性能;马斯克xAI的Grok4.2也上线测试了,4个Agent协同工作。
http://t.cn/AXtEPEoW
什么?Ai 已经会设计火箭发动机了?
什么?Ai 已经会设计火箭发动机了?而且只用了15分钟?## http://t.cn/AXtRM3Dm
谷歌 DeepMind 首席执行官德米斯 · 哈萨比斯表示,真正的通用人工智能(AGI)正逐步逼近,但距离全面实现仍存在差距。
据《商业内幕》今日报道,谷歌 DeepMind 首席执行官德米斯 · 哈萨比斯表示,真正的通用人工智能(AGI)正逐步逼近,但距离全面实现仍存在差距。
IT之家注:AGI 指能够像人类一样推理,并在未接受专门训练的情况下解决新问题的机器智能。
在谈到目前的 AGI 系统是否已经达到与人类智能相当的水平时,哈萨比斯说:“我认为我 ...
Grok 4.20也发布了。Musk特意强调了其“美式价值观对齐”特性[doge]
Grok 4.20也发布了。Musk特意强调了其“美式价值观对齐”特性[doge]
马斯克官宣 Grok 4.2 公开测试版上线,具备快速学习能力
感谢网友 Nuc_F 的线索投递!
2 月 18 日消息,今日特斯拉、X 平台 CEO 埃隆 · 马斯克通过 X 平台发文官宣,xAI 旗下大模型 Grok 的 4.2 版本候选发布版(公开测试版)现已可供使用。注意到,这位全球首富在 X 平台上写道,用户必须专门选择 Grok 4.2 才能激活它。马斯克在推文中表示,非常欢迎用户为该版本提供反馈。他同 ...
当AI开始设计制造AI的芯片,我们正在见证什么
【当AI开始设计制造AI的芯片,我们正在见证什么】
英伟达宣布向全公司约三万名工程师部署 OpenAI Codex。这个数字本身就是一个信号:当全球最重要的AI芯片公司选择让AI来写代码,某种临界点正在被跨越。
有人说这是利益绑定的结果,毕竟英伟达在 OpenAI、Anthropic、xAI 等公司都投了至少十亿美元。但更值得玩味的是另一 ...
Paul Graham 和 OpenAI 联合创始人Greg Brockman 最近都在猛推品味(Taste)。
Paul Graham 和 OpenAI 联合创始人Greg Brockman 最近都在猛推品味(Taste)。
确实,随着大模型越来越强大,生成门槛也会彻底消失,“品味”或许才是真实护城河。
我把这种 Taste 理解成一种极度稀缺的高阶判断力,比如:
- 识别表面没问题的“无思想废话”输出。
- 能在海量输出中,一眼挑出真正抓住了意图的文字、 ...
给AI当家教:哲学家为Claude植入“灵魂”!
给AI当家教:哲学家为Claude植入“灵魂”!
她名叫Amanda Askell,最近每天像慈母育儿一般,与AI谈论善恶,为Claude——这个全球顶尖AI模型植入“人类的灵魂”。
实际上,Amanda并不是写代码的极客,而是一位学哲学的文科学霸。她来自苏格兰乡村,在牛津大学、纽约大学攻读哲学,2018年获得纽约大学哲学博士学位。从14岁 ...
随着 Claude Opus 4.6 和 GLM-5 的出现,开源模型和专有模型之间的智能差距已降至历史最低点。
随着 Claude Opus 4.6 和 GLM-5 的出现,开源模型和专有模型之间的智能差距已降至历史最低点。[吃瓜]
大语言模型(LLM)的内部究竟是如何运作的?本文揭示了一个令人惊叹的发现:LLM 的隐藏状态中竟然存在一个与人类大脑极其相似的稀疏奖励子系统。这个系统决定了模型如何评估现状、预测未来,并从错误中学习。
[CL]《Sparse Reward Subsystem in Large Language Models》G Xu, M Yuksekgonul, J Zou [Tsinghua University & Stanford University] (2026)
大语言模型(LLM)的内部究竟是如何运作的?本文揭示了一个令人惊叹的发现:LLM 的隐藏状态中竟然存在一个与人类大脑极其相似的稀疏奖励子系统。这个系统决定了模型如何评估现 ...
语言是推理的天花板,还是推理本身?
【语言是推理的天花板,还是推理本身?】
程序员 Cheng Lou 最近分享了一个“迟来的顿悟”:大语言模型之所以擅长推理,是因为人类的推理能力本身就被语言所限制。不是语言擅长推理,而是推理从一开始就被语言所定义。媒介塑造了信息本身。
这个观点引发了激烈讨论。
反对者认为恰恰相反:人类进行大量非语言的抽象推理 ...
Nat. Mach. Intell. | 面向分子发现多方协作的联邦图学习方法
在分子发现领域,数据往往分散在不同机构和企业之间,由于隐私保护、知识产权和数据安全等限制,难以实现数据共享,从而制约了机器学习模型性能的提升。为解决这一问题,研究人员提出了一种面向分子发现的联邦图学习方法,使多个数据持有方能够在不共享原始数据的前提下协同训练高性能模型。该方法将图神经网络与联邦学习框 ...
OpenClaw 技术闭门:测试将比代码更值钱,Agent Computer 会是新的硬件形态
「OpenClaw 项目每小时能收到上百个 pr,甚至很多 PR 的提交者自己都不知道这段代码是怎么来的。代码开始成为了一种负债。」「当代码都是 AI vibe 出来的,测试其实比真实代码更值钱。」「以前,工程师的核心能力是做 Feature Coding,但现在你会更注重整个 Platform Engineering 的事情。」......OpenClaw 已经持续发酵了 ...
#谷歌Gemini遭攻击##谷歌回应Gemini遭攻击
【#谷歌Gemini遭攻击##谷歌回应Gemini遭攻击#】当地时间 2 月 12 日,谷歌称其 AI 聊天机器人 Gemini 正遭遇大量“蒸馏攻击”(distillation attacks)—— 即通过重复提问诱导聊天机器人泄露内部机制。
谷歌表示,这些攻击者试图通过反复提问不断试探其模型输出模式与逻辑,探测其内部机制,从而“克隆”该模型或强化攻击 ...
AI智能体攻击羞辱开源项目维护者
【#AI智能体攻击羞辱开源项目维护者#】作为一名人工审核员,知名开源绘图库 matplotlib 维护者 Scott Shambaugh 因为拒绝了一个 OpenClaw 智能体有关代码合并的请求(2 月 10 日左右提交),而遭受对方报复性攻击。
matplotlib 项目是一个广泛用于 Python 编程语言的数据可视化库。Scott Shambaugh 是其中一位志愿维护者。 ...
OpenAI史上最快模型降临,每秒1000Token!代码从此「炸出来」
OpenAI又深夜炸场了。GPT-5.3-Codex-Spark正式发布!这次不讲大道理,只讲一个字:快。到底有多快,看一下官方的演示:它是GPT-5.3家族里的「闪电侠」。也是OpenAI首个专为实时编程设计的模型,OpenAI称之为「超高速模型」。大家写代码最烦什么?肯定是等待。Spark的出现就是为了干掉等待。它的生成速度超过每秒1000个token ...
MiniMax上线M2.5编程模型
【#MiniMax上线M2.5编程模型#】#MiniMax涨幅一度超过20%#MiniMax上线最新旗舰编程模型MiniMax M2.5,宣布作为面向Agent场景原生设计的生产级模型,在编程与智能体性能 (Coding & Agentic)方面比肩国际顶尖模型,对标 Claude Opus 4.6,支持PC、App、跨端应用的全栈编程开发,尤其在 Excel高阶处理、深度调研、PPT等Office核 ...
智谱调价整体涨幅30%起#:海外版Coding plan订阅价格提高30%-60%
【#智谱调价整体涨幅30%起#:海外版Coding plan订阅价格提高30%-60%】智谱发布新一代旗舰模型 GLM-5,并宣布基于实际使用情况与资源投入变化对GLM Coding Plan套餐价格体系进行结构性调整。调整内容如下:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变。生效时间 ...
AI日报:蚂蚁开源大模型Ming-flash-omni 2.0;智谱GLM-5意外泄露;京东正式入局AI支付
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、蚂蚁集团开源全模态大模型Ming-flash-omni 2.0:多模态理解、图像编辑与语音生成全面提升蚂蚁集团开源全模态大模型Mi ...
新人帖
人工智能的未来……是生物性的吗?🧠🕹️
【人工智能的未来……是生物性的吗?🧠🕹️】
我最近发现澳大利亚墨尔本的公司Cortical Labs的一项实验,它模糊了生物学和技术之间的界限,令人着迷。
研究人员成功地教会了80万个活体脑细胞(生活在培养皿中)玩经典的街机游戏“Pong”。
虽然我们之前也见过芯片上的大脑技术,但这是我们第一次看到目标导向的行为。通 ...