高瓴人工智能学院文继荣 、窦志成团队推出深度推理智能体DeepAgent
信息来源:人大新闻网 发布时间 2025年11月10日
近日,来自中国人民大学高瓴人工智能学院文继荣、窦志成团队与小红书等机构的研究者提出了DeepAgent——一个端到端的深度推理智能体,能够在单一连贯的推理过程中自主思考、发现工具并执行动作。
它颠覆了传统智能体的预定义工作流,将思考、工具发现与执行全部融合在一个统自主的推理进程中。通过引入自主记忆折叠机制和端到端强化学习训练方法ToolPO,DeepAgent在8个基准测试中持续超越基线方法,在标注工具和开放集工具检索场景下均表现出色。这项工作为构建更通用、更强大的真实世界智能体迈出了重要一步。
该研究首次实现了基于大语言模型的“先思考、后反应”生成范式,有效缓解了无提示条件下反应生成的模糊性与误差累积问题,为在线、无约束的多人生成场景提供了具备语义可解释性与动态适应能力的新一代解决方案,标志着人体交互运动生成进入“语义引导、分步推理”的新阶段。
DeepAgent将思考、工具发现和执行统一到单一推理过程中,开创了端到端推理智能体的新范式。通过自主记忆折叠机制和ToolPO训练方法,DeepAgent在通用工具使用和下游应用任务中显著超越现有基线,特别是在需要动态工具发现的开放集场景中表现优异。这项工作为开发更通用、更强大的真实世界智能体开辟了新的途径。
Copyright ©2016 中国人民大学科学技术发展部 版权所有
地址:北京市海淀区中关村大街59号中国人民大学明德主楼1121B 邮编:100872
电话:010-62513381 传真:010-62514955 电子邮箱: ligongchu@ruc.edu.cn
京公网安备110402430004号