中科大认知智能实验室发布Agent-R1开源框架

中科大认知智能实验室发布Agent-R1开源框架,核心突破是端到端强化学习与大语言模型的深度融合,打破传统人工工作流局限。

其三大技术创新亮眼:过程奖励机制实时评估工具调用有效性,动作掩码技术精准区分行为与反馈,模块化架构兼容主流LLM工具与算法。

该框架支持多模态,集成视觉-语言模型,1.5B小模型可自主完成多跳问答推理,将智能体升级为具备交互、试错能力的自主系统,赋能6G协同等领域。 http://t.cn/AXGH7Q92
分类