免费领取大会全套演讲PPT    

点击领取

我要参会

马骁腾

Macaron AI首席科学家

马骁腾,Macaron AI首席科学家,Mind Lab Director,聚焦以真实交互经验驱动的个性化智能体训练与RL infra平台能力建设。清华大学自动化系博士、博士后,发表强化学习相关论文30余篇,谷歌学术引用1400余次。

演讲主题

迈向经验智能:从 Context Engineering 到 Context Learning

大模型能力的持续增强,让智能体成为落地应用的核心形态。但要让模型真正具备经验智能(Experiential Intelligence),不能只靠人工编排的上下文(Context Engineering),更需要模型从真实的交互数据中学习、积累和复用经验,即走向 Context Learning。 本次分享将介绍 Mind Lab 在这方面的工程实践:我们研发了面向万亿参数模型后训练的 LoRA-RL 训练底座 MinT,支撑高吞吐、低成本的强化学习快速迭代。并以 Macaron 模型训练为案例,展示如何利用 Context Learning 教会模型操作 Dynamic UI,将交互经验沉淀为可复用的模型能力与训练管线。 项目地址:https://github.com/MindLab-Research/mindlab-toolkit 大模型后训练的演进:从 Context Engineering 到 Context Learning 对比两条能力增强路径,解释为何智能体场景下,让模型从交互中学习是走向经验智能的关键。 Context Learning 的核心挑战 探讨在真实交互中面临的难点:如何构造有效的训练信号、建模长程记忆、保证经验的可复用性。 MinT:面向万亿参数模型的 LoRA-RL 训练底座 介绍 MinT 的核心设计与工程实现,展示其如何实现高吞吐、低成本的后训练,并支撑 Agent / Tool Use 等场景的快速迭代。 Macaron 案例:用 Context Learning 训练 Dynamic UI 交互能力以 Macaron 模型为例,展示如何从用户交互数据中获取经验轨迹,将多步 UI 交互能力沉淀进模型参数,形成可迭代的训练流水线。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号