@zijin235关于PyTorch对于模型训练的影响求教 中发帖

各位佬,目前我使用Github里IBM的Seq2Seq的模型库来训练一个简单的Seq2Seq模型做生成任务。所有的代码没有做改动。当conda环境中 pytorch是比较新的版本,同时cuda用的12.x时,模型在训练过程中就不会收敛。然后我降低版本同时用了低版本的cuda,torch用的1.81,cuda用的11.1,进行模型训练,就发现模型能训练起来了。。效果还不错。。 
所以CUDA版本和Torch版本对于模型的训练也是有影响的?