害你的猪 (@zhousp666) 在 沉浸式翻译使用本地ollama就很慢,是什么问题? 中发帖
6卡4090
[image]
部署了ollama启动参数是
[image]
ollama里部署了个gemma3n:e4b 终端聊天 rate:在70 tokens/s左右
觉得速度还不够快
现在又部署了个gemma3:1b 终端聊天 rate:在140 tokens/s左右
[image]
Cherry Studio聊天速度也快,很正常。
但是到了chrome浏览器沉浸式翻译插件里翻译网页
要么是不响应,要么就很慢很慢,翻译基本卡住。