刘广
智源基础数据研究组负责人
北京邮电大学智能科学与技术博士,北京智源人工智能研究院基础数据研究组负责人,有悟道·天鹰Aquila系列基础模型(7B/34B/8x16B)开发和开源经验,在人工智能领域学术会议和期刊上发表论文,现在关注高质量数据合成技术等研究方向。
演讲主题
Infinity Instruct: 合成指令技术的探索
指令微调是引导语言模型落地、构建高性能对话模型的关键一步。针对目前开源的指令数据集质量低、覆盖领域少、数据信息不透明等问题,智源研究院推出了千万级指令微调数据集Infinity Instruct以及后续升级和更新。