免费领取大会全套演讲PPT    

立即领取

梁家卿

复旦大学大数据学院青年副研究员

梁家卿博士,复旦大学大数据学院青年副研究员,专注于知识图谱与大模型的认知智能研究。在TKDE、AAAI等顶级会议和期刊发表论文50余篇,研发的知识图谱与大模型应用平台累计被调用超17亿次,拥有近20项专利。曾获语言与智能技术竞赛信息抽取比赛第一名。主持研发的中文大模型 CuteGPT 在多家公司落地应用。曾获ACM-ICPC区域赛金牌、TopCoder Open全球前150名、吴文俊人工智能奖科技进步奖等多项荣誉。

演讲主题

面向领域的大模型思维能力

近年来,大模型在通用智能领域取得了显著进展,但面向特定领域的思维能力仍面临挑战。以o1和r1类模型为代表,其强大的推理能力为领域应用提供了新思路。然而,复杂指令下的多约束遵循、领域思维的精准模仿、强化学习试错与工具利用,以及混合工具支持的复杂思维过程,仍是大模型应用中的核心痛点。需要聚焦于这些瓶颈,探索如何提升大模型在领域任务中的表现。例如,在复杂指令场景中,模型需准确理解并满足多重约束,而非简单生成答案;在领域思维模仿中,要求模型深度捕捉行业逻辑与专家经验;通过强化学习试错,结合外部工具,提升解决动态问题的能力;最终,在混合工具的复杂思维过程中,实现多步骤推理与资源整合。o1 类模型在这些方面的潜力令人期待,但也暴露出通用性与专业性间的权衡。我们旨在通过优化训练范式与工具集成,推动大模型更好地服务于领域应用,释放其在复杂场景中的思维潜能。 大纲: 引入:大模型在通用领域的局限与 o1 类模型的推理潜力。 核心问题:复杂指令遵循难、领域思维模仿弱、工具利用生硬。 研究重点: 推理模型的复杂指令遵循能力评估和提升 结合领域思维的Agent推理框架 基于试错的工具灵活应用训练 结合工具的实验思维过程 展望:领域应用案例与大模型的未来发展。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号