- 刚才用Codex coding,模型GPT-5.4,它在思考的时候,出现了神奇的一幕——出现了一段一般是在网页被篡改劫持时候的一段代码… (0篇回复)
- 在对话记忆检索领域,如何在有限token预算内从海量历史会话中精准召回相关证据,是悬而未决的难题。 (0篇回复)
- 在形式化数学推理领域,反例生成长期处于被忽视的角落。 (0篇回复)
- 中国大模型版图全扫描:谁是真正的玩家? (0篇回复)
- 有朋友问我,为啥在网页使用 AI 大模型,跟自己调用 API 时感觉不一样,差别很大呢? (0篇回复)
- 让AI帮我总结这篇论文 (0篇回复)
- Sebastian Raschka的新长篇文章:A Visual Guide to Attention Variants in Modern LLMs 现代大型语言模型注意力变体视觉指南 (0篇回复)
- 大家都在追求更大的LLM... 但GPU显存正在角落里默默流泪。😭 (0篇回复)
- deepseek是什么?deepseek究竟是什么? (0篇回复)
- 全球生成式AI应用排名出炉 韩国A.与Papago跻身前50位[围观] (0篇回复)
- 小米交作业了! 一口气放出两个新模型! (0篇回复)
- Kimi K2.5被同行点赞 (0篇回复)
- [CL]《Attention Residuals》G Chen, Y Zhang, J Su, W Xu… [Kimi Team] (2026) (0篇回复)
- 我以前介绍过Kitten TTS,只有25M的语音模型,可以用CPU推理,甚至手机也能跑。 (0篇回复)
- OpenClaw 创始人 Peter 转发了这个最适合 OpenClaw 的模型排行榜,图 2 这个榜是任务成功率榜。 (0篇回复)
- Anthropic威胁OpenCode移除Claude集成引发争议 (0篇回复)
- 🚨突发新闻:Qwen 团队刚刚发布了他们的官方代理框架,它包含了所有功能。 (0篇回复)
- 孤独大脑:哪个大模型最好用? (0篇回复)
- 🚀MiniMax-M2.7 上线 Ollama Cloud:88% 自进化胜率,SWE-Pro 56.22% 直逼 Opus (0篇回复)
- 刚刚小米在mimo官网正式公开了mimo-v2大模型系列的新成员,有Pro,omni和tts。 (0篇回复)