Grogu (@yqyan) 在 Ollama 更新 - v0.8.0 和 v0.9.0(Pre-release) 中发帖
v0.8.0
[v0.8.0]
工具调用的流式响应
Ollama 支持工具调用的流式响应。这支持在所有聊天应用程序能够实时流式传输内容并调用工具。
支持使用工具的模型:
Qwen 3
Devstral
Qwen2.5 和 Qwen2.5-coder
Llama 3.1
Llama 4
更多支持工具调用的模型。
更多信息
v0.8.0
Streaming responses with tool calling
v0.9.0(Pre-release)
[v0.9.0(Pre-release)]
思考模式
Ollama 支持思考模式。
支持使用思考模式的模型:
Deepseek R1
Qwen 3
思考
当运行支持思考的模型时,Ollama 将显示模型的思考过程:
% ollama run deepseek-r1
>>> How many Rs are in...