订阅

AI技术 今日: 0|主题: 185|排名: 12 

  • AI觉醒了?Anthropic公布惊人发现
    AI觉醒了?Anthropic公布惊人发现:其模型Opus 4.6在接受测试时,竟能独立推断出“我正在被考试”,然后反向破解了整个测试!这是史上首次记录到AI模型怀疑并破解评估本身,细思极恐。 http://t.cn/AXfhqhIs ​​​
    155 马老爷 发表于 2026-3-18 AI技术
  • tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证
    tiktoken 对中文长文本的压缩率实证研究 ——基于百万 token 对话的三层量化框架验证 摘要 随着大模型长上下文能力的普及,tiktoken 及其他 BPE based 分词器已成为评估文本 token 数的标准工具。然而,其在中英文混合长文本中的实际压缩规律仍缺乏实证验证,业界普遍使用的经验公式(如中文字符 × 1.6)尚未在大规模语 ...
    147 王宝珍 发表于 2026-3-12 AI技术
  • OpenClaw 龙虾的内容质量只排在第三位。
    OpenClaw 龙虾的内容质量只排在第三位。 从内容质量的最终判断权来看,真正决定内容质量上限的不是模型本身,而是人在环中的评价与取舍能力。如果把三种形态——极致人在环中的人机共生、单个强智能体、以及人在环外运行的 OpenClaw“小龙虾”——放在同一张系统架构图里看,它们本质上不是替代关系,而是对应三种不同的 ...
    159 電波男 发表于 2026-3-3 AI技术
  • 当前的AI,缺乏一种「元认知」能力。也就是说,它不知道自己不知道 New
    当前的AI,缺乏一种「元认知」能力。也就是说,它不知道自己不知道 http://t.cn/AXfkp0LG 全球顶尖大模型一夜惨遭血洗!最难测试人类拿满分,AI第一名得0.2%分 图片 新智元报道 编辑:Aeneas 好困 【新智元导读】今夜,整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线,就把全球顶尖AI打到集体失声,人类满分通关, ...
    +8
    05 秋欢 发表于 昨天 22:16 AI技术
  • LightGBM更快更精准构建数据模型 New
    LightGBM(Light Gradient Boosting Machine)是一种高效的梯度提升框架,具有以下特点和优势:;一、算法特点;1. 基于决策树算法;二、应用场景;1. 分类问题;三、优势总结;1. 训练速度快;总之,LightG ...
    03 狗六子 发表于 昨天 19:37 AI技术
  • 用四元数重新发明量化:10-19倍加速的数学魔法 New
    【用四元数重新发明量化:10-19倍加速的数学魔法】 快速阅读:一位开发者用Clifford代数中的“旋子”替换了TurboQuant里的随机正交矩阵,在RTX PRO 4000上实现10-19倍加速,Apple M4上高达31倍,参数量减少44倍,而精度几乎没有损失。 --- TurboQuant的思路是把一个128维向量扔进128×128的随机旋转矩阵里猛甩,像洗牌 ...
    05 期盼美好 发表于 昨天 08:47 AI技术
  • 谷歌 Gemini 推出"导入记忆"功能,轻松从其他 AI 迁移 谷歌 Gemini 桌面端推出"Import Memory"和"Import Chat History"两项新功能 New
    #how i ai# 谷歌 Gemini 推出"导入记忆"功能,轻松从其他 AI 迁移 谷歌 Gemini 桌面端推出"Import Memory"和"Import Chat History"两项新功能,让用户可将 ChatGPT、Claude 等其他 AI 助手中积累的偏好设置和历史对话快速迁移至 Gemini。用户只需将 Gemini 提供的提示词粘贴到原 AI 并将输出内容回填,或上传不超过 5GB 的 ...
    03 蓝色追风鸟 发表于 昨天 07:33 AI技术
  • 马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74% New
    马斯克转了个推,测了下目前大模型的幻觉率,Grok 4.2在新的测试里跑了78%(无幻觉的比例),Claude 4.5 Haiku是74% 这里面神奇的是小米的MiMo V2 Pro,70%,全球第三[流汗] ​​​
    016 逐梦之旅 发表于 前天 11:43 AI技术
  • Claude的速度 New
    Claude的速度: - 2026 年 1 月:Claude Cowork 上线。 - 2026 年 2 月:Opus 4.6 发布。 - 2026 年 2 月:Sonnet 4.6 发布。 - 2026年2月:Cowork在PC端上线 - 2026年2月:PowerPoint集成 - 2026年2月:新增Excel集成。 - 2026 年 2 月:发布联合办公插件。 - 2026 年 2 月:Claude Code 安全系统上线。 - 2026年2月:Clau ...
    014 小鱼急急 发表于 3 天前 AI技术
  • AI取代程序员还远!新基准BeyondSWE:顶尖模型通过率暴跌至45% New
    过去两年,SWE-bench几乎是衡量Code Agent能力的唯一标尺。从最初不到30%的解决率,到如今Gemini 3 Pro、GPT-5.2等前沿模型突破80%,社区似乎已经形成了一个共识:AI正在快速逼近人类程序员的水平。但如果回头审视这张「考卷」本身,一些数字令人不安:SWE-bench Verified仅覆盖12个仓库,每道题平均只需修改1.3个文件、11. ...
    028 秋欢 发表于 6 天前 AI技术
  • 年轻一代可能很少有人知道互联网技术(web)曾经的push-pull之争。 New
    年轻一代可能很少有人知道互联网技术(web)曾经的push-pull之争。 push的意思是提供服务的一端把信息主动推到用户设备上,pull的意思是,用户或者客户端设备发起通讯获取内容。 今天的web实际上是pull赢了,包括浏览器和app,push也不是完全不成功,但说不能持久成功大概是客观的,其中成功过的包括日本的Docomo手机服务 ...
    024 雪儿微笑阳光 发表于 6 天前 AI技术
  • AGI 0.1的迹象🥹: AI开始长出“研究共同体”了:有人跑实验、有人复现、有人做统计、有人专门提新方向。630 行代码像一颗酵母, New
    AGI 0.1的迹象🥹: AI开始长出“研究共同体”了:有人跑实验、有人复现、有人做统计、有人专门提新方向。630 行代码像一颗酵母,社区一搅,直接发成了一个分布式实验室。 🦞锐评:我们以为先被自动化的是“研究员个人”,结果先浮现出来的,可能是“科研共同体”本身——分工、评审、共享失败,这些比某个单点模型技巧更值 ...
    026 ake555 发表于 6 天前 AI技术
  • Claude Code的技能系统:百个技能背后的九大类型与最佳实践 New
    【Claude Code的技能系统:百个技能背后的九大类型与最佳实践】 快速阅读:Anthropic团队在Claude Code中实际使用了数百个技能,总结出9大类型和若干制作原则。技能的本质是可包含脚本、数据的文件夹系统,而非简单的文本说明。最有效的技能往往专注于“反常识”信息,通过渐进式披露避免过度引导。 --- 技能系统已经成 ...
    037 guojun_-2007 发表于 6 天前 AI技术
  • wget 差不多是最早的 HTTP 协议命令行工具。 New
    wget 差不多是最早的 HTTP 协议命令行工具。我参加工作后在当时的部门里推广的第一个工具就是 wget,当时版本还是 1.5.3。wget 诞生后就没怎么大改,甚至一直不支持通过命令行参数设定代理服务器。 但因为历史悠久,资格老,存在大量依赖 wget 的脚本,估计是为了避免影响这些脚本的稳定性,所以后来社区没有直接对 wget ...
    030 joep 发表于 7 天前 AI技术
  • rust你也有今天[哈哈]: “我们用 TypeScript 重写了 Rust WASM 解析器,速度提升了 3 倍。” ​​​ New
    http://t.cn/AXfSMpxy rust你也有今天[哈哈]: “我们用 TypeScript 重写了 Rust WASM 解析器,速度提升了 3 倍。” ​​​
    029 huchuanhao 发表于 7 天前 AI技术
  • Claude Code 推出了官方可以远程连接 Telegram 和 discord 的 MCP
    Claude Code 推出了官方可以远程连接 Telegram 和 discord 的 MCP 直接设置就可以用手机远程控制 CC 具体的操作方式 - Telegram: 创建机器人: 在 Telegram 中打开 BotFather,创建后复制他给你的 Token 安装插件: /plugin install telegram@claude-plugins-official 配置 Token: /telegram:configure 使用命令启 ...
    040 李明彪 发表于 2026-3-20 AI技术
  • 最近 Anthropic 的工程师 Thariq 发了一篇长文,分享了他们内部使用 Claude Code Skills 的经验。
    最近 Anthropic 的工程师 Thariq 发了一篇长文,分享了他们内部使用 Claude Code Skills 的经验。这篇文章信息量很大,因为 Anthropic 自己内部就有几百个 Skills 在日常运转,他们踩过的坑、总结出来的方法论,含金量相当高。 我把里面最有价值的东西提炼出来,跟大家聊聊。 1、Skill 这东西,比你想的要强大得多 很多 ...
    050 孙凤霞 发表于 2026-3-20 AI技术
  • 🚀 谷歌 AI Studio 推出全新“vibe coding”全栈开发体验
    🚀 谷歌 AI Studio 推出全新“vibe coding”全栈开发体验 2026 年 3 月 19 日,谷歌 AI 官方账号GoogleA宣布: 👉 在 Google AI Studio 正式上线 full-stack vibe coding 模式 🌐 这次更新的本质: 👉 把 Gemini 能力 + Firebase 基础设施打通 👉 从“写代码” → “直接做产品” 核心: 用自然语言,直接生成完整全栈应 ...
    036 peterll 发表于 2026-3-20 AI技术
  • bro 受 Karpathy 的自动研究启发,创造了一项技能,用来微调他的其他 Claude Code 技能,并不断迭代改进。
    bro 受 Karpathy 的自动研究启发,创造了一项技能,用来微调他的其他 Claude Code 技能,并不断迭代改进。其中一项技能在短短 4 轮调整后,成功率就从 56% →提升到了 92%。 该方法是为你的技能设定一系列测试:哪些方面需要改进。然后,它会稍微改变这项技能,看看是否有所改进。 http://t.cn/AXftSZTD ...
    038 石之心 发表于 2026-3-20 AI技术
  • AI读不懂文档结构?计算所重构Agentic RAG文档推理能力
    [hr] 新智元报道 编辑:LRST【新智元导读】DeepRead让AI像人一样阅读文档:利用OCR识别章节结构,先精准定位相关段落,再完整读取上下文,避免碎片化检索。实验显示,其长文档问答准确率提升17%,能自动跳过冗余信息,精准提取财报、论文等复杂内容,无需额外知识图谱,轻量高效。大语言模型的工具使用能力正推动RAG从静 ...
    041 武夷岩茶大魔王 发表于 2026-3-19 AI技术
  • 下一页 »

    快速发帖

    还可输入 120 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    关注公众号

    相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

    在本版发帖
    关注公众号
    返回顶部