Bunn (@BunnHack) 在 Cogito 在开放许可下发布最强大的 LLM,规模分别为 3B、8B、14B、32B 和 70B 中发帖
总部位于旧金山的人工智慧研究新创公司Deep Cogito 今天正式推出 Cogito v1,这是一系列新的开源大型语言模型 (LLM),由 Meta 的 Llama 3.2 微调而来,配备混合推理能力——能够快速、立即回答,或像 OpenAI 的“o”系列和 DeepSeek R1 一样进行“自我反省”。
• 我们将以开放许可的方式发布规模分别为 3B、8B、14B、32B 和 70B 的最强 LLM 模型。在大多数标准基准测试中,每个模型的表现均优于同规模的最佳开放模型,包括 LLaMA、DeepSeek 和 Qwen 的同类模型。尤其是 70B 模型,其性能甚至优于新发布的 Llama 4 109B MoE 模型。
• 我们计划在未来几周/几个月内发布更大的模型,包括 109B、400B、671B,以及针对每种模型尺寸改进的检查点。
模型详情
我们将发布使用此方法训练的 3B...