冷大炜
360人工智能研究院副院长、多模态方向负责人
冷大炜博士,360人工智能研究院副院长,多模态方向负责人,中国图象图形学学会理事,带领团队聚焦在 “多模态+跨模态学习” 以及 “大模型 + zero/few shot学习”方向,在中文图文跨模态学习、开放世界目标检测、开放词表视频分析、AIGC图像生成以及多模态大模型等领域展开前沿算法研发和工业落地工作,以研发业内一流技术为使命,引领业务方向,创造落地价值。相关成果落地于安全大数据、互联网信息分发、企业数字化、AIoT等360 集团全量业务场景,支持千万级硬件设备,服务于亿级用户。
演讲主题
FG-CLIP – 面向大规模搜广推的高精度图文对齐与向量化
图文跨模态对齐与向量化模型,已成为互联网搜索、广告、推荐、安防及办公图文检索等场景的底座基础模型。然而,传统 CLIP 及其衍生微调版本长期受限于“只见森林、不见树木”的整体语义偏好,难以捕捉细粒度细节,对齐精度始终受限;与此同时,高并发、低延迟的业务红线,又使体积庞大的多模态大模型(LMM)难以真正落地。 本演讲将分享360人工智能研究院在该方向的最新成果FG-CLIP,深入解析FG-CLIP如何突破上述双重瓶颈的思路,并阐述其出色性能背后的设计思考。