刘广
智源数据研究组负责人,OpenSeek/FlagAI负责人
刘广,智源人工智能研究院数据研究组的负责人,负责OpenSeek/FlagAI等开源项目,主导开发了悟道天鹰(Aquila)系列语言大模型,以及Infinity Instruct千万指令数据集系列等重要项目,目前正专注于基于大模型的数据合成技术的研究与应用,致力于推动该领域的技术进步和创新。
演讲主题
Infinity Instruct: 合成指令技术的探索
指令微调是引导语言模型落地、构建高性能对话模型的关键一步。针对目前开源的指令数据集质量低、覆盖领域少、数据信息不透明等问题,智源研究院推出了千万级指令微调数据集Infinity Instruct以及后续升级和更新。