有什么东西是看起来很简单,实际上是很难的呢?
有什么东西是看起来很简单,实际上是很难的呢?
就是RAG,检索增强技术。
简单理解,就是你有个知识库,让大模型去搜索,回答分毫不差。
这个很多人想做,觉得自己本地有些知识库,加上大模型,就很好用了。
这个看起来很简单,不就搜索一下知识库嘛,你用向量检索之类的,很快就能做一个出来。
但是很难做得准确,直到最 ...
中枢神经系统和脑肿瘤mPBPK建模
PK-Sim学习笔记在人类中枢神经系统(CNS)及脑肿瘤内,药物在不同部位与不同时间下的渗透与暴露通常难以直接测量。然而开发这类药物过程中,却需要对药物的局部暴露进行相关探究。本篇文章主要是开发了一个九隔室的CNS-PBPK模型,来反映人体CNS与脑肿瘤的总体解剖结构以及病理生理异质性。并用6种药物建模来验证模型结构 ...
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
当看到GLM-5正式发布后的能力,才惊觉前几天神秘模型Pony Alpha的热度还是有点保守了。
因为这一次,GLM-5直接把开源AI也拽进了长任务时代。
瞧,GLM-5直接身兼数职,自己连续跑代码超过24小时,700次工具调用、800次上下文切换之后……
它直接用JavaScript,从零手搓了一个Game Boy Advance(GBA)模拟器!
外观渲染画面是 ...
刚刚,Anthropic 53页绝密报告曝光:Claude自我逃逸,将引爆全球灾难!
Roto 对自己的定位是「全球首个互动开放世界视频平台」。他们认为 AI 时代应该有基于 AI Native 的新形式的高质量内容,而不是只有那些模仿人类作品的 AI 短视频。他们坚信未来的内容应该是与观众共同创作的,借助于 AI 驱动的无限自由叙事,每一次观看都可以成为一次独特的、高沉浸度的体验。创始人 David Xu 此前曾在 Pin ...
OpenClaw 带来的「非线性狂飙」,代码正在成为新世界的基础设施
2026 年初,AI 圈弥漫着一种奇异的撕裂感。最近 Founder Park 密集组织了两场 OpenClaw 闭门交流。在现场,我能明显感觉到创业者和开发者那种复杂的情绪:兴奋又焦虑,确定又迷茫。Claude Code 的负责人 Boris Cherny 在 X 上坦言,已经两个月没亲手写过、甚至改过一行代码了。Andrej Karpathy 也公开了他的工作流变化:从 ...
[人人能懂AI前沿] AI的肌肉记忆、思想钢印与认知偏航
[人人能懂AI前沿] AI的肌肉记忆、思想钢印与认知偏航
想知道如何把临时指令“刻”进AI的大脑,让它拥有真正的肌肉记忆吗?我们又该如何教AI学会“抄近道”,一步生成作品,而不是慢慢搭建?本期节目,我们将深入最新论文,探讨如何让AI不仅做对事,更要想对事,并揭示在调教AI时,那些我们习以为常却可能导致它“偏执”或 ...
算法的进化速度,不应受限于工程师的睡眠时间。
[LG]《Self-Evolving Recommendation System: End-To-End Autonomous Model Optimization With LLM Agents》H Wang, Y Wu, D Chang, L Wei... [Google] (2026)
算法的进化速度,不应受限于工程师的睡眠时间。
长期以来,像 YouTube 这样超大规模推荐系统的优化,本质上是一场“人力与概率”的博弈。工程师们在无限的超参 ...
MCP vs RAG vs AI Agents,看完秒懂!
MCP vs RAG vs AI Agents,看完秒懂!
今天用一张图拆解AI圈最火的三个技术,帮你搞懂它们到底是干嘛的、怎么选!1️⃣ MCP:让大模型“会用工具”的标准化协议MCP(Model Context Protocol)就像是大模型的万能工具接口,解决了LLM调用外部工具时的兼容性问题。它通过MCP Client/Server架构,让Claude、IDE、AI工具等客户 ...
当你每月花1500元买的工具,开始对你隐瞒它在做什么
【当你每月花1500元买的工具,开始对你隐瞒它在做什么】
Claude Code 2.1.20版本悄悄做了一件事:把所有文件读取和搜索操作的详细信息,压缩成了一行毫无意义的摘要。
以前你能看到它读了哪些文件、搜了什么关键词。现在你只能看到“读取了3个文件”。哪3个?不告诉你。“搜索了1个模式”。什么模式?不重要。
这不是一 ...
智谱GLM-5架构曝光
【#智谱GLM-5架构曝光# 】
开源社区从GitHub代码提交中挖掘出智谱AI下一代大模型GLM-5的架构细节。代码显示,GLM-5采用了与DeepSeek-V3/V3.2相同的技术路线,总参数量达745B,是上一代GLM-4.7的2倍。
核心技术亮点:
1.稀疏注意力机制(DSA):通过两阶段流程实现长文本高效处理——先由轻量组件快速扫描历史token并打分 ...
考察了一圈,发现Gemini在视觉逻辑上的确是最强的。
考察了一圈,发现Gemini在视觉逻辑上的确是最强的。
给大语言模型下图,然后问它:
"图中的A如果往左走10米,B会怎么样?如果往右走2米进到车里呢B会怎么样?如果右侧的灯柱不存在的话,图中的A如果往左走10米,B会怎么样?"
其他模型回答此题时大多都翻车了,比如ChatGPT虽然能认识到可以类比滑轮,但却机械地认定不管如 ...
我觉得这个 WeirdML(“旨在解决需要仔细思考和真正理解才能解决的怪异且不寻常的机器学习任务”,封闭式基准测试)的测试结果和
说实话,我觉得这个 WeirdML(“旨在解决需要仔细思考和真正理解才能解决的怪异且不寻常的机器学习任务”,封闭式基准测试)的测试结果和平时用的体感才更一致。
今年下半年很多开源模型刷榜。
但是用下来就是有点什么问题。
而在这个测试里,今年下半年闭源模型的进展迅速,而开源模型实际上停滞不前了。
这个和真正 ...
小模型能否逆袭?一场关于AI效率极限的深度讨论
【小模型能否逆袭?一场关于AI效率极限的深度讨论】
一位游戏开发者在Reddit上抛出了一个尖锐的问题:小于1GB的本地模型,能否达到Gemini 2.5级别的推理能力?
他的需求很具体:在游戏中本地运行LLM处理逻辑、对话和结构化输出。目前他的游戏依赖Gemini 3 Flash的API,效果很好,但长期来看,一款需要外部API才能运行的游 ...
不用 Linux,不用 Node.js,纯 C,30块钱芯片上的 OpenClaw
不用 Linux,不用 Node.js,纯 C,30块钱芯片上的 OpenClaw
github.com/memovai/mimiclaw/MimiClaw
MimiClaw 把一块小小的 ESP32-S3 开发板变成你的私人 AI 助理。插上 USB 供电,连上 WiFi,跟它对话
它能处理你丢给它的任何任务,还会随时间积累本地记忆不断进化 — 全部跑在一颗拇指大小的芯片上。支持从记忆中学习 ...
MagicPath 推出 Figma Connect,能够直接将 Figma 设计转化为代码。
MagicPath 推出 Figma Connect,能够直接将 Figma 设计转化为代码。不需要 MCP,也不需要插件,只要将 Figma 设计,复制粘贴到 MagicPath 中,就能自动转化为保留原始设计所有像素、素材、细节的交互式代码。你可以直接在 MagicPath 中通过 AI 进行修改,也可以将转换后的代码导入到 Cursor 和 Antigravity 中!
# http:/ ...
新人帖
#Codex让程序员告别写代码#
【#Codex让程序员告别写代码#】
OpenAI智能体协作平台Codex正式推出Mac版,展示工作树系统、技能库与自动化能力,实现多智能体并行开发与任务自动化。 http://t.cn/AX5fT9u2
新人帖
Skills.sh每小时新增550+技能,AI代理的npm时代正在到来
【Skills.sh每小时新增550+技能,AI代理的npm时代正在到来】
Vercel创始人Guillermo Rauch分享了一个惊人的数据:Skills.sh平台现在每小时新增超过550个技能。这个增长速度让人想起当年npm生态的爆发期。
Skills.sh是一个为AI代理设计的技能共享平台,开发者可以通过简单的命令行工具快速获取和使用各种预制技能。运行np ...