免费领取大会全套演讲PPT    

我要参会

报名领取

丁瑞雪

阿里巴巴通义实验室高级搜索算法专家

目前主要负责通义百炼产品RAG算法架构与通义实验室其他多个产品RAG的离线算法技术。7年NLP&AI算法研发以及落地经验。曾在ACL、EMNLP、NAACL、SIGIR等顶级会议上发表多篇论文,研究领域涉及NLP传统任务、多模态预训练、RAG。曾提出业界第一个地理多模态预训练模型MGeo,下载量过百万。目前致力于流程化、模块化的可落地RAG技术方案建设,开源了CQDA RAG数据集以及CoFE-RAG全链路RAG评估框架。

演讲主题

通义百炼RAG应用落地实践与挑战

随着大模型应用的迅猛发展,RAG作为外挂大脑实现将用户的知识库注入大模型使用过程中,对大模型能力起到重要的补充作用。但实践应用时,复杂的知识格式、多模态知识内容通常会对RAG系统提出很大的挑战。除此之外,随着长文本大模型的兴起,传统基于分块策略的RAG系统已逐渐无法满足新的场景范式。最后在落地时,如何针对客户场景评估RAG系统的可靠性与准确性,给出针对性解决方案,也是影响RAG技术发挥实际作用的关键性问题。本次演讲将介绍通义百炼RAG应用在过去一年的落地实践中遇到的主要问题,并将我们的解决方案与大家分享。 大纲: RAG技术概览 需求与背景 近一年技术发展 实践挑战 复杂图文解决方案 知识库的复杂性 结合多模态LLM的离线解析 技术方案介绍 长文本RAG 长文本agent 效果展示 未来方向 RAG评估 问题介绍 业界方案 CoFE-RAG评估框架 效果展示

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号