中科大认知智能实验室发布Agent-R1开源框架

曲直

2026-02-15 09:35:32

中科大认知智能实验室发布Agent-R1开源框架，核心突破是端到端强化学习与大语言模型的深度融合，打破传统人工工作流局限。

其三大技术创新亮眼：过程奖励机制实时评估工具调用有效性，动作掩码技术精准区分行为与反馈，模块化架构兼容主流LLM工具与算法。

该框架支持多模态，集成视觉-语言模型，1.5B小模型可自主完成多跳问答推理，将智能体升级为具备交互、试错能力的自主系统，赋能6G协同等领域。 http://t.cn/AXGH7Q92

相关阅读