周俊
蚂蚁集团副总裁,国家级创新领军人才
主要研究方向为基础大模型、机器学习等人工智能技术,致力于相关领域的技术创新与应用。在学术方面,已发表AI领域顶会论文百余篇,H-index为52,并获得3项国际最佳论文奖及41项美国授权专利。在云计算跟大数据领域,作为早期技术团队成员,参与了国内唯一自研的云计算操作系统(飞天)的建设,为该技术的大规模商业化应用奠定了基础。 作为阿里和蚂蚁AI的创始成员之一,深度参与并负责构建了多个大规模AI项目,包括双11电商个性化推荐、人工智能平台PAI、图学习系统AGL、AI风控、支付宝智能化等。带领团队在4项国际算法评测中排名第1,并获得教育部科学研究优秀成果奖一等奖、陕西高等学校科学技术研究优秀成果特等奖、CCF科技进步1等奖、吴文俊人工智能科技进步1等奖、电子学会科技进步1等奖和浙江省科技进步1等奖等多个AI领域奖励,帮助提升了核心科技竞争力。
演讲主题
从语言到推理:百灵大模型的 AGI 探索
大模型正在经历从“语言智能”向“推理智能”的关键跃迁。过去,我们通过 Scaling Law 持续提升模型的知识容量与表达能力;而在迈向 AGI 的过程中,模型的核心挑战正在转向——如何在复杂环境中进行推理、决策并最终完成任务。 本次演讲将系统性回顾蚂蚁集团自研百灵大模型的技术演进路径,从早期基于 Scaling Law 的模型构建出发,深入剖析其在架构优化、生成与理解统一、多模态融合等关键方向的实践与突破。在此基础上,将进一步探讨大模型能力的下一阶段:从“语言能力”走向“推理能力”,以及由此带来的模型范式变化。 围绕百灵大模型的持续迭代,将重点分享百灵在代码理解与生成(coding)、多步推理(reasoning) 以及 Agent 能力(任务执行)方面的最新进展,展示模型如何从“生成内容”进化为“完成复杂任务”。 最终,我们希望回答一个核心问题:当大模型具备推理与行动能力,AI 是否正在从“工具”演化为“智能系统”?