Grogu (@yqyan)IBM 更新 Granite 模型,Granite-3.2 正式发布 中发帖

Granite-3.2 是长上下文的 AI 模型,经过微调以具备思考能力。模型基于 Granite-3.1 构建,使用了许可开放的开源数据集和为推理任务设计的内部生成的合成数据混合进行训练。模型允许对其思考能力进行控制,确保仅在需要时使用。 
模型有两种参数规模,分别是2B和8B:

Granite-3.2-2B-Instruct
Granite-3.2-8B-Instruct

用途:
模型旨在处理一般的指令跟随任务,可以集成到各个领域的AI助手当中,包括商业应用。
功能:

思考
总结
文本分类
文本提取
问题-回答
检索增强生成(RAG)
与代码相关的任务
函数调用任务
多语言对话用例
长上下文任务,包括长文档/会议摘要、长文档问答等

Granite-3.2 已经可以直接使用 Ollama 进行本地部署