LovenSar 在 【4张4090不工作】最新版Ollama拉取qwen3:30b结果跑在CPU而GPU不工作。 中发帖
今天一大早Qwen3就发布了,然后尝试试一下30b的MoE模型,32b的Dense模型也下载了。
更新了最新的ollama之后,尝试运行,但是显卡都没有工作,全在CPU跑。
[image]
我看DEBUG日志里面都是启动了CPU。
[67fdd58bacd5afa1ef2f4235b2749b1c]
看一下CPU占用,直接拉满了,但是GPU却一点动静没有。
[image]
基本上是一秒两三个字符出现。
[image]
我下载部署好ollma和30bmoe之后,我是使用了以下参数启动了ollama serve。
{
“CUDA_VISIBLE_DEVICES”: “”,
“HIP_VISIBLE_DEVICES”: “”,
“HSA_OVERRIDE_GFX_VERSION”: “”,
“OLLAMA_DEBUG”: true,
“OLLAMA_FLAS...