免费领取《AI原生软件研发成熟度模型 AISMM》白皮书    

点击领取

我要参会

Bryce Adelstein Lelbach

NVIDIA首席工程师、CUDA C++ 核心库主管

Bryce Adelstein Lelbach 拥有十余年编程语言、编译器及软件库开发经验,长期致力于推动并行编程的发展,并希望让并行编程对更多开发者更加易于使用。他现任 NVIDIA 首席工程师,创立了 NVIDIA Core C++ Compute Libraries 团队,目前领导 Vanguard Programming 团队,负责推动 NVIDIA 在编程语言、编译器及核心软件库方向的技术路线规划。 Bryce 是系统编程语言社区的重要领导者,曾担任 C++ Library Evolution 工作组主席及美国编程语言标准委员会主席。多年来,他还担任过众多技术大会的组织者和程序主席。在 C++ 标准委员会中,他主导和参与了并发原语、并行算法、Senders 模型以及多维数组等关键标准特性的设计与推进。 此前,他曾任职于 Lawrence Berkeley National Laboratory 和 Louisiana State University,并是 HPX 并行运行时系统的创始开发者之一。 工作之外,Bryce 热爱飞机与腕表,目前与女友和爱犬居住于 Midtown Manhattan。

演讲主题

使用Tile进行GPU编程

并行编程常常让人望而生畏,但其实并非如此!如今,一种对新手更友好、开发效率更高且性能优异的并行编程新范式正在兴起:基于 Tile 的编程模型。 在本次以案例驱动的分享中,我们将介绍如何在 Python、C++ 和 Rust 中进行 Tile 编程,并展示 NVIDIA 全新的 Tile 编程技术栈 cuTile 以及其底层依托的新一代编译器栈 Tile IR。 你将了解 CUDA Tile 最新发布的一系列新特性,包括多 GPU 通信、与传统 CUDA SIMT 模型的互操作能力,以及对卷积、Stencil 等更多类型 Kernel 的支持。 我们还将对比 Tile 编程模型与传统并行编程模型的差异与特点。 分享中将展示多个来自不同领域的实践案例,包括 HPC Stencil 计算、稀疏矩阵向量乘(SPMV)、共轭梯度(CG)求解器,以及来自 TileGym 的 AI 模型。 Tile 编程的思想起源于多个 HPC 库,例如 NWChem 的 TCE、BLIS 和 ATLAS。近年来,这一范式在 GPU 编程领域迅速流行,并被 Triton、JAX/Pallas、Warp 等语言与框架广泛采用。 在本次分享中,你将: 学习面向 GPU 编写 Tile 并行应用的最佳实践 深入理解 Tile 代码的性能表现及其底层执行机制 掌握分析与调试 Tile 应用的方法 理解 Tile 编程与传统并行编程的核心差异,以及各自适用场景 了解在新硬件趋势下,Tile 编程如何提升软件可移植性 通过本次分享,你将全面理解 Tile 编程如何为 HPC、数据科学和机器学习场景带来更直观、更高效、更具可移植性的高性能数据并行开发方式。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号