@stevessr 在 来学 cutile(python) | developed by nvidia 中发帖
[!info]+ 简介
cuTile Python 是一种用于 NVIDIA GPU 的编程语言。官方文档可在 docs.nvidia.com 上找到,或者可以从 docs 文件夹中的源代码编译。
目前需要 CUDA Toolkit 13.1+ ,并且需要单独安装。
[!quote]+
NVIDIA® CUDA® Tile 是一种基于分块的 GPU 编程模型,旨在提高 NVIDIA Tensor Core 的可移植性。CUDA Tile 通过简化跨 NVIDIA 平台创建优化的、基于分块的内核的编程模型,释放 GPU 的峰值性能。
CUDA Tile 基于 Tile IR 规范和工具,包括 cuTile,它是面向用户的 Python(以及未来将支持的 C++)语言,用于支持 CUDA Tile IR (中间表示)。NVIDIA 的 Python 实现是 cuTile...