DeepResearcher:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。
实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
#DeepResearcher #AIAgent
实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
#DeepResearcher #AIAgent
GitHub
GitHub - GAIR-NLP/DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments.
Scaling Deep Research via Reinforcement Learning in Real-world Environments. - GAIR-NLP/DeepResearcher