AI大模型一起港湾 - Powered by Discuz! Archiver

LLM 是人类有史以来最强大的通用工具 (0篇回复)
很有趣的一篇论文。 (0篇回复)
刚才用Codex coding，模型GPT-5.4，它在思考的时候，出现了神奇的一幕——出现了一段一般是在网页被篡改劫持时候的一段代码… (0篇回复)
在对话记忆检索领域，如何在有限token预算内从海量历史会话中精准召回相关证据，是悬而未决的难题。 (0篇回复)
在形式化数学推理领域，反例生成长期处于被忽视的角落。 (0篇回复)
中国大模型版图全扫描：谁是真正的玩家？ (0篇回复)
有朋友问我，为啥在网页使用 AI 大模型，跟自己调用 API 时感觉不一样，差别很大呢？ (0篇回复)
让AI帮我总结这篇论文 (0篇回复)
Sebastian Raschka的新长篇文章：A Visual Guide to Attention Variants in Modern LLMs 现代大型语言模型注意力变体视觉指南 (0篇回复)
大家都在追求更大的LLM... 但GPU显存正在角落里默默流泪。😭 (0篇回复)
deepseek是什么？deepseek究竟是什么？ (0篇回复)
全球生成式AI应用排名出炉韩国A.与Papago跻身前50位[围观] (0篇回复)
小米交作业了! 一口气放出两个新模型! (0篇回复)
Kimi K2.5被同行点赞 (0篇回复)
[CL]《Attention Residuals》G Chen, Y Zhang, J Su, W Xu… [Kimi Team] (2026) (0篇回复)
我以前介绍过Kitten TTS，只有25M的语音模型，可以用CPU推理，甚至手机也能跑。 (0篇回复)
OpenClaw 创始人 Peter 转发了这个最适合 OpenClaw 的模型排行榜，图 2 这个榜是任务成功率榜。 (0篇回复)
Anthropic威胁OpenCode移除Claude集成引发争议 (0篇回复)
🚨突发新闻：Qwen 团队刚刚发布了他们的官方代理框架，它包含了所有功能。 (0篇回复)
孤独大脑：哪个大模型最好用？ (0篇回复)

页: 1 2 3 [4] 5 6

一起港湾's Archiver