免费领取大会全套演讲PPT    

报名领取

我要参会

星龙

MiniMax技术总监

长期研究 AI + Infra 领域。在MiniMax 后负责基础设施工作, 包括高性能 AI 基础设施、超大规模预训练训练框架、DevOps 平台及 SRE。曾在旷视负责大规模 GPU 集群稳定性和高性能网络改造,并在百度负责超大规模 Kubernetes 集群混部系统研发。

演讲主题

大模型在AI Infra方面的挑战与实践

当前预训练模型的规模和模型复杂性不断增加,这给基础设施带来了巨大的压力。为了应对这些挑战,构建更大规模的高性能训练集群,企业往往需要进行全链路的优化,包括算法、硬件架构和系统设计的创新,以提高效率和性能。同时,高性能算力面对较大的供给压力,通过混合云的方式来缓解算力不足,完成成本与灵活性的双收益。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号