免费领取大会全套演讲PPT    

报名领取

我要参会

张俊林

新浪微博新技术研发负责人

中国中文信息学会理事,中科院软件所博士。目前担任新浪微博技术研发负责人,在此之前在阿里巴巴担任资深技术专家,负责新技术团队。《这就是搜索引擎:核心技术详解》、《大数据日知录:架构与算法》的作者,目前主要研发兴趣集中在推荐系统及自然语言处理

演讲主题

原生多模态大模型的方法与问题:以Gemini为例

内容简介:多模态大模型是当前国际前沿大模型的竞争主战场,典型例子是OpenAI的GPT-4V和谷歌的Gemini之争。目前有两种主流的多模态大模型做法:拼接式多模态 vs 原生(Native)多模态,公开的多模态大模型大多采取拼接技术路线,主要原因在于相对原生多模态模型,拼接式多模态大模型制作成本较低。Gemini是典型的原生多模态大模型,本次分享将深入解析Gemini的可能制作方法,通过对谷歌发布的Gemini技术报告深入分析,并结合主流的多模态大模型技术,介绍原生多模态大模型的方法要点,以及面临的急需解决的技术问题。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号