- TW93的新长篇教程:《你不知道的大模型训练:原理、路径与新实践》 (0篇回复)
- 国产AI编程大模型跻身全球第一梯队 (0篇回复)
- Qwen3.6-Plus没有开源 没发预热,直接甩干货。 (0篇回复)
- 微软的AI部门刚刚发了三款自研模型(看来真的是有点不想要OpenAI了),微软的自研模型叫MAI。 (0篇回复)
- Qwen3.6 可能会部分开源 (0篇回复)
- Gemma 4 发布:面向推理与本地部署的开源模型 (0篇回复)
- 谷歌放出了最新开源模型:Gemma 4,型号从手机到工作站全覆盖 (0篇回复)
- 谷歌发布 Gemma 4 开源大模型,31B 参数性能达头部水准 (0篇回复)
- OpenAI 发布 GPT-5.4:面向专业工作,强化表格、文档、编程与智能体能力 (0篇回复)
- 世界模型不会取代LLM,它是LLM缺失的那一层 (0篇回复)
- 过去24小时,AI 圈的空气里,都是焦灼和狂欢。 (0篇回复)
- Google 宣布免费开放 Gemini 2.0 等 AI 工具 (0篇回复)
- 3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务 (0篇回复)
- 阿里巴巴最近推出的Qwen3.5系列模型广受好评,尤其是122b和27b这两个小模型。 (0篇回复)
- 和一位给OpenClaw贡献了核心代码的朋友聊天,几点感受 (0篇回复)
- 处理大型复杂文档,ChatGPT 跟 claude 的差距就会非常明显 (0篇回复)
- 谷歌开源了一个时间序列基础模型。 (0篇回复)
- 谷歌发布的新人工智能报告。人类历史上的每一次智能大爆发都是社会性的,而非个体性的。 (0篇回复)
- 之前介绍过的项目“大道至简”minimind更新了不少。该项目会带你完全之前介绍过的项目“大道至简”minimind更新了不少。 (0篇回复)
- 在生成式视觉建模领域,分词器与扩散模型必须分阶段训练是一个被默认接受的工程枷锁:先冻结编码器,再在固定潜空间上训练生成模型。 (0篇回复)