免费领取大会全套演讲PPT    

报名领取

我要参会

李彤

潞晨科技副总裁

李彤,现任潞晨科技副总裁,毕业于帝国理工学院,曾在顶级会议 EMNLP, NeurIPS 发表相关论文,拥有5 年自然语言处理,自然语言生成相关经验,Colossal-AI 算法应用核心开发者。

演讲主题

Sora开源复现架构模型与训练揭秘

摘要: 随着视频内容创作和消费的迅猛增长,OpenAI Sora凭借其出色的视频生成技术成为行业的领跑者。紧随其后,Colossal-AI团队率先推出类Sora架构开源视频生成模型Open-Sora 1.0。 本次演讲将详细介绍Open-Sora 1.0的复现方案,包括其三个关键阶段的训练流程:大规模图像预训练、视频预训练和数据微调,以及这些步骤如何共同作用于提升生成视频的质量和真实感。此外,演讲还将探讨数据预处理、模型训练细节和加速优化策略,以及未来的发展计划。 听众将从本次演讲中获得对Open-Sora 1.0模型的深入理解,包括其在视频生成领域的创新应用和实际效果。演讲将揭示模型的关键技术特点,以及如何通过高效的数据处理和训练流程实现高质量的视频生成。此外,听众将了解到如何将这些技术应用于自己的项目中,从而提升内容创作的质量和效率。演讲还将探讨模型未来的发展方向,为听众提供行业发展的新视角和灵感。通过这次演讲,听众将能够更好地把握视频生成技术的最新趋势,为自己的研究或创作工作带来新的启发和价值。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号