夏伟
腾讯代码大模型技术专家
中国科学院大学硕士,目前负责Codebuddy 代码大模型的产研工作。曾先后在华为、腾讯参与大语言模型相关项目的技术研究和应用实践,覆盖大模型在推荐、教育、代码等多个领域的应用,提升产品核心竞争力,为用户带去更多AI的便利和快捷感受。在EMNLP, AAAI, KDD, WWW, WSDM等国际会议发表学术论文数篇
演讲主题
AI Coding 人机协作新范式:CodeBuddy 的模型探索与工程实践
本次分享将围绕 AI Coding 人机协作范式展开。首先,我们会回顾智能编程行业的发展背景,分析技术演进脉络与应用趋势;随后介绍CodeBuddy的产品形态与核心能力。接着,将深入剖析代码大模型训练的实践经验,包括数据合成方法,以及模型在代码补全、NES、Craft Agent 等任务上的训练策略,覆盖预训练、持续预训练到后训练阶段(SFT、RLHF)的完整流程。同时,我们会分享一些多维度评测体系的设计理念与实践经验,并结合线上实验验证效果。最后,对技术演进方向与未来规划进行总结与展望。