免费领取大会全套演讲PPT    

报名领取

我要参会

王文斓

小冰公司计算机视觉算法专家

王文斓,现任小冰公司计算机视觉算法专家,主导X Eva APP视觉算法方案的开发与创新,研发的AIGC和人脸驱动技术应用于X Eva APP的AI beings视觉表达,促成视频通话、拍同款等产品功能落地。在此之前,王文斓担任虎牙公司AIGC技术方向负责人,带领团队研发的工业化素材生产及场景结构化等AIGC技术被广泛应用于虎牙助手和虎牙直播APP,渗透率超过30%。王文斓在AI与游戏行业的多个顶级行业会议上分享其研发成果,听众超过13000人次,并发表过多篇技术白皮书、专利及论文。

演讲主题

小冰AI Beings的视觉革新:个性化表达的挑战与突破

Transformer技术带来了AI的第二波发展,尤其在图像与视频生成领域。Latent Diffusion Model (LDM) 引领了一系列以Stable Diffusion (SD)为首的图像生成模型和开发者社区,OpenAI基于LDM改造的Diffusion Transformer视频生成模型Sora震惊了世界,Diffusion已经成为图像和视频生成方面的首选训练方式。小冰公司在这一技术领域进行了深入的探索,通过SD技术实现了精准的“拍同款”功能,同时兼顾美与像,深受用户喜爱,满足个性化的视觉内容需求。 本次演讲我将分享我们在此项目中的实战经验,包括底座模型评测、最佳的自动化训练图筛选策略、LoRA训练细节、独特的工作流设计,再到模板制作和个性化合照生成等一系列技术实践。通过实验证明,每个阶段的实现方式不同,最终生成的结果也会有明显的区别, 如何设计和平衡成为影响最终输出的关键要素。 本次分享将涵盖项目中遇到的挑战、解决方案、关键技术点,以及对未来技术趋势的思考。我们致力于为AI技术研究者和应用开发者提供深度经验交流和借鉴,共同推进AIGC在AI beings视觉表达方面的应用与发展。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号