张俊林
新浪微博首席科学家及AI研发部负责人
张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博首席科学家及AI研发部负责人,此前在阿里巴巴担任资深技术专家,负责新技术团队。技术书籍《这就是搜索引擎:核心技术详解》、《大数据日知录:架构与算法》作者。
演讲主题
从DeepSeek R1的复现看深度思考模型的未来
DeepSeek R1开源后,学术界涌现大量复现研究,涵盖SFT阶段的轻量适配(如S1)与RL阶段的创新实践。本次分享将系统梳理其技术脉络,重点解析两阶段训练范式:冷启动微调结合多领域数据优化,通过GRPO强化学习与全场景对齐实现能力跃迁。 本分享试图回答其中关键技术问题,比如RL Scaling Law的界限在哪里?影响SFT阶段蒸馏方法效果的关键因素是什么?怎么解释DeepSeek 提到的Aha Moment等。