@Dirac_Sea 在 slurm集群调度系统如何实现多任务共享GPU? 中发帖
求教佬们,手上有几台GPU机器装了双4090,平时运行大负载任务的时候,是通过slurm系统提交的,slurm系统分配资源有个问题:比如一个任务需要使用一张显卡,slurm会分配一张显卡让这个任务独占,被独占的GPU利用率不高的话,显然可以再上一个任务,但是由于slurm分配会独占显卡,那么如果我想使用slurm提交新任务,新任务就只能排队,不能让两个任务同时使用这个GPU;显卡资源不能最大化利用。
有什么方法可以让slurm实现多任务共享一个GPU呢?