陈巍
千芯科技董事长
陈巍博士,大模型+AI芯片专家,高级职称,千芯科技董事长。国际计算机学会(ACM)、中国计算机学会(CCF)专业会员。研究方向为大模型架构、稀疏量化压缩与部署加速,存算一体、AI芯片与3D Chiplet处理器,相关技术成果已被广泛应用于知名IDC和互联网企业。曾任领域知名人工智能(自然语言处理)企业首席科学家,中国科学院副主任(2012),多个国家科技重大专项课题负责人。中国与美国发明专利软件著作权约70+项(约50+项发明专利已授权)。著有《Sora大模型技术精要—原理、关键技术、模型架构与未来趋势》《GPT-4大模型硬核解读》《ChatGPT大模型技术精要—发展历程、原理、技术架构详解和产业未来》《智能网联汽车:激光与视觉SLAM详解》等。
演讲主题
视频大模型架构解析及其芯片级训练部署挑战
随着Sora和Stable Video Diffusion等模型技术逐渐成熟,视频大模型(VLM)正与短视频产业结合并迎来新的爆发机遇,必将成为互联网和影视产业的热点。本次分享从视频大模型与世界模型的角度,介绍Sora、SVD等视频大模型基本架构、关键技术(包括NaViT、RADM);探讨视频大模型具体训练流程与部署成本,分析内存墙(Memory Wall)和通信墙对视频大模型带来的训练效率和落地挑战;针对这类大序列模型的算力芯片级训练部署,结合具体项目给出软硬结合的解决方案与系统经验。 大纲: 1视频大模型与世界模型 2 Sora等视频大模型架构对比分析 3 视频大模型的关键技术 4 视频大模型训练与部署挑战 5 从算法到芯片的大序列模型训练与部署方案