免费领取大会全套演讲PPT    

点击领取

我要参会

乔子乐

通义实验室算法科学家、通义DeepResearch核心作者

北京大学软件工程博士,通义实验室算法科学家。深度参与Qwen-2.5与Qwen-3系列大语言模型的预训练、后训练等研发工作。 专注于Agentic AI研究领域, 作为阿里首个开源深度研究Agentic LLM-通义DeepResearch的核心研发者,负责Agent模型构建的全流程。工作贯穿虚拟环境设计、高质量数据构造、前沿Agent范式探索、模型预训练与后训练等多个关键阶段。在Humanity's Last Exam、BrowseComp、BrowseComp-zh、GAIA等多个权威Agent评测基准上取得全面领先性能。

演讲主题

通义DeepResearch:SOTA级AI智能体的全栈构建方法论

阿里巴巴近期发布了全开源的Agentic LLM“通义DeepResearch”,其在多项高难度网页信息检索与推理基准测试中取得突破性成果,性能媲美甚至超越顶尖闭源模型。 该工作不仅开源了高性能模型,更首次完整公开了一套可复现的全栈Agent构建方法论,其核心技术突破涵盖三个方面: 1.创新的Agent范式: 介绍模型在基础ReAct模式下的卓越性能,并展示为解决极端复杂任务而设计的创新范式——IterResearch(深度模式),通过动态规划与重构工作空间,有效保障了Agent在长程推理中的稳健性能。 2.数据合成飞轮:揭示如何通过对任务进行形式化建模与构建自动化流程,实现大规模、超越人类专家水平的复杂训练数据的自生成与迭代优化,从而突破Agentic LLM性能的上限。 3.一体化训练流程: 阐述从Agentic CPT、SFT,到On-Policy RL的完整流程,揭示Agent能力演进的内在机制。 大纲:一、引言与核心成果;二、Agent范式——从基础推理到深度研究;三、全链路数据合成 ;四、一体化训练流程;

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号