何万青
清程极智副总裁
何万青博士,现任清程极智副总裁,曾任燧原科技高级总监,负责 Turnkey 系统与应用优化业务,历任英特尔 DCAI 首席工程师,阿里云高性能计算负责人、资深技术专家,360 云 CTO , Motorola 与国电电力研发经理等职;何博士 99 年毕业于上海交大,从业 25 年来,何博士专注于 HPC并行优化、云计算与 AI 应用性能调优,并付出大量时间在 CCF 产学研合作上,历任中国计算机学会理事、CCF高专委常委、CCF YOCSEF总部副主席、ACM杭州副主席、CNCC 2022/23/24 技术论坛企业界主席与委员等,授予中国计算机学会总部荣誉委员、CCF杰出讲者和杰出贡献奖等十余项奖项。撰写并行开发、云计算相关书籍3本,翻译出版互联网、科普与工程技术书籍 5 本,获得电子工业出版社 40 周年杰出贡献奖与湛庐出版社 2024 年度最佳译者。
演讲主题
大模型训练推理优化技术与Turnkey性能交付
介绍清程极智在Chitu推理引擎和bagualu训练优化工具集背后的优化技术,以及Turnkey(太极)性能交付平台,拆解Chitu推理引擎在超越算子集的算法+推理引擎+算子的联合优化,探讨如何将工程优化以PaaS产品形式输出,分享bagualu模块微调优化、图编译、混合量化、内存管理和异构训练等模块原理的组合在实践中的应用,给出通过Turnkey平台实现推理的E2D优化模版,包括并不限于亲和性优化、负载均衡以及缓存优化在实际案例的运用,给出在K8S集群实现PD分离的实践。 大纲: - 问题提出与分析,从科学计算到AI推理的数学模型,对精度和算法的需求; - Chitu推理引擎的前世今生,技术路线介绍 - 八卦炉训练优化的各模块原理 - Turnkey太极性能交付引擎原理与实现 - 优化案例