Lee Jack (@Lee_Jack1)我也是用上H100的人啦 中发帖

http://hpaste.spiritlhl.net/code/E6LnwH.txt 
[image]
[image]
发现单个 h100 用ollama跑不动deepseek-coder 236b版本的,现在大模型行业真卷,提供模型服务应该得用不少卡吧
单卡跑qwen2.5 72b感觉速度也是一般般
[image]