Xiaoiec (@_xiaoiec) 在 NV 的cuTile带来的新可能性?这个项目已经在行动了 中发帖
我最近英伟达发布 cuTile 的事情在圈子里讨论挺热烈的。还看到有大佬分析说,NV 这是承认了 SIMT 模型太难,主动把编程粒度抬升到了 Tile(数据块)级别。有人说这是降低门槛,也有人说是自毁 CUDA 护城河。
不过,我也不是卖GPU的,毁不毁护城河我无所谓,能让我有好东西用就行了。正好我刚刚在GitHub上发现了一个有关这个的项目,叫 OTIR (Open Tile IR) 的项目。
这个项目的思路也挺有意思的:既然 Tile 编程是未来,那就不应该让它只属于 NVIDIA(天下苦NVIDIA久矣了属实是)。OTIR 试图基于 MLIR 定义一套硬件无关的 Tile 中间表示。将算法意图与底层硬件实现解耦,实现了一个更高的抽象层来面向对象。
看文档介绍,它的目标是把“显式存储层级”和“异步数据流”标准化,理论上能通过不同的后端映射到 N 卡、华为昇腾、甚至是ARM,RIS...