免费领取大会全套演讲PPT    

报名领取

我要参会

张俊林

新浪微博新技术研发负责人, 中国中文信息学会理事

中国中文信息学会理事,中科院软件所博士。目前担任新浪微博技术研发负责人,在此之前在阿里巴巴担任资深技术专家,负责新技术团队。《这就是搜索引擎:核心技术详解》、《大数据日知录:架构与算法》的作者,目前主要研发兴趣集中在推荐系统及自然语言处理

演讲主题

AI for AI:如何让大模型来制作大模型

目前,大语言模型的设计涉及到多个关键环节,包括数据收集、模型结构、SFT、RM模型构建、RLHF等,每个环节都需要大量繁琐复杂的人工介入,为了改善模型效果,也需要算法研究人员不断设计各种优化技术与方案。大模型技术发展的趋势是在各个关键环节由大模型本身来替代人工工作,以降低模型建造成本并加快模型迭代速度。本次分享将介绍在大语言模型各种关键环节中,如何利用大模型来自动设计效果更好的大模型,以实现大模型的自我进化目标。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号