zerohenry 在 (求助)MPI阻塞优化 中发帖
目前情况是目前有A和B两台服务器,每台各一个GPU,然后两台服务器靠通信,共同跑一个物理仿真,但是mpi在两个节点并行那个仿真的时候 gpu大部分时间都在等待数据中 仿真的每个时间步都要统一粒子信息后才进行下一个时间步 导致目前mpi在通信阻塞状态,佬友们有这方面的研究吗 。目前已经在尝试低延迟数据压缩了,mpi部分还有优化的空间吗。