倪冰冰 | 2024全球机器学习技术大会

免费领取大会全套演讲PPT

报名领取

我要参会

倪冰冰

上海交通大学教授

倪冰冰，男，现为上海交通大学教授，博士生导师。2010-2015年于美国伊利诺伊大学香槟分校新加坡高等研究院(University of Illinois at Urbana-Champaign, Advanced Digital Science Center Singapore)担任研究科学家。2005年在上海交通大学电子工程系获学士学位；2011年在新加坡国立大学 (National University of Singapore) 电气与计算机工程系获博士学位。博士期间，先后在微软亚洲研究院和谷歌公司美国总部工作。主要研究方向为计算机视觉、机器学习与多媒体计算，专长媒体内容生成(AIGC)，视频理解，以及端侧智能，是国内最早开展视觉内容智能生成研究的学者之一。倪冰冰博士发表论文200余篇，其中IEEE T-PAMI、IJCV等人工智能领域顶级期刊论文20余篇；CVPR、ICCV、ECCV、NeurIPS、ICML, ICLR, AAAI, MICCAI等中国计算机学会推荐A类会议论文100余篇。所发表论文的Google Scholar引用次数为14000余次，H-因子60，获爱思唯尔2022全球高引学者。倪博士担任国际计算机视觉顶级会议ICCV2019，ECCV2020，ECCV2022, CVPR2023，NeurIPS2023领域主席。

演讲主题

视觉目标的矢量化表征与内容生成技术

Stable diffusion、SORA等新框架的问世，极大地提升了生成式人工智能（包括图像、图形、视频等）的视觉质量。然而，以概率分布拟合为目标的黑盒式深度网络模型的难以本质上消除语义结构错误、细节内容不精确不真实的难题，并且用户难以在各颗粒度上精确控制生成结果。此外，视觉模态数据维度极高，而目前生成式模型所采用的数据表征形式无法兼顾表征效率、计算密度、渲染质量、以及操控灵活性。针对上述挑战，我们提出了视觉目标的矢量化表征与内容生成新框架，通过将视觉内容（图像、视频、2D/3D图形等）进行语义分层解构，形成不同颗粒度实例化视觉对象；对于各对象实例的内部形状空间，构建语义部件引导下的分布式参数表达，并在各视觉属性通道构建基于神经基元的组合式参数表达。上述新型表征范式在2D/3D视觉内容的形状、纹理、材质、运动等属性的紧凑可伸缩表达生成、高质量重建与渲染、精细化编辑与交互等任务中取得了极佳的性能，为未来媒体智能生成的框架演进提供了有益的探索路径。

Boolan 秉承“全球专家，连接智慧”的宗旨，通过汇聚全球顶尖IT技术专家，致力于为广大企业用户提供高端IT技术和产品领域的技术咨询、技术会议、企业内训、专家讲座、研讨会、测评认证等服务。

Boolan公众号

扫一扫，获取大会最新内容

沪ICP备15014563号-6