LovenSar 在【4张4090不工作】最新版Ollama拉取qwen3:30b结果跑在CPU而GPU不工作

LovenSar 在【4张4090不工作】最新版Ollama拉取qwen3:30b结果跑在CPU而GPU不工作。中发帖

今天一大早Qwen3就发布了，然后尝试试一下30b的MoE模型，32b的Dense模型也下载了。 
更新了最新的ollama之后，尝试运行，但是显卡都没有工作，全在CPU跑。 
 [image] 
我看DEBUG日志里面都是启动了CPU。 
 [67fdd58bacd5afa1ef2f4235b2749b1c] 
看一下CPU占用，直接拉满了，但是GPU却一点动静没有。 
 [image] 
基本上是一秒两三个字符出现。 
 [image] 
我下载部署好ollma和30bmoe之后，我是使用了以下参数启动了ollama serve。 
{ 
“CUDA_VISIBLE_DEVICES”: “”, 
“HIP_VISIBLE_DEVICES”: “”, 
“HSA_OVERRIDE_GFX_VERSION”: “”, 
“OLLAMA_DEBUG”: true, 
“OLLAMA_FLAS...