潘欣
闪极AI CTO
主要从事Diffusion, MLLM模型的研发和应用。AI工程和算法十年工作经验,曾在Google Brain参与TensorFlow、TPU开发和CV、NLP、Speech深度学习算法研究。负责百度飞桨从0到1的重构。开发腾讯无量推荐系统,支撑腾讯数亿DAU用户的内容推荐。负责字节AIGC和视觉大模型AI平台,支持抖音、Tiktok、剪映等产品。
演讲主题
腾讯PCG推荐系统实践
腾讯PCG包含大量的推荐场景,比如QQ浏览器,QQ看点,QQ空间,腾讯视频,腾讯新闻,微视,应用宝等等。 PCG中台的推荐系统支撑了PCG大部分业务多样化的推荐需求,每天生产数千个模型,部署近万台机器,支撑千亿级调用。 推荐系统主要包含了自研的特征计算平台、无量深度学习框架和Ronda Serving系统。提供推荐的全流程能力。 这套系统还被应用到搜索,广告等其他领域。 无量深度学习框架支持TB级别模型的分布式训练和预测,支持CPU/GPU异构高性能计算,多级存储架构。 Ronda Serving系统通过Servable以插件化方式,支撑无量,TensorFlow, Pytorch, TensorRT等多种框架。 Serving Controller打通机器学习平台和容器管理平台,自动化的完成模型的服务发布,模型上线,动态扩所容能力。
深度学习框架技术的演进