Bunn (@BunnHack)挑战全球 AI 巨头!印度公司 Sarvam AI 发表 30B 与 105B 大模型,接近国内Qwen3和GLM 4.5 Air的水平 中发帖

印度人工智慧新创公司 Sarvam AI 近日于技术峰会上正式亮相其最新研发成果,推出两款重量级大型语言模型:Sarvam-30B 与 Sarvam-105B。并声称纯自研(从零开始打造LLM) 
[HBbFzwEbcAANCrk]
作为本次发表的亮点之一,Sarvam-30B 模型在训练规模上达到了 16 兆(16T)Tokens。这使得该模型在理解语言细微差别与知识广度上具有极佳表现。

技术规格: 拥有 32k tokens 的上下文窗口(Context Length)。
基准测试表现: 根据官方公布的数据,Sarvam-30B 在 Math500、HumanEval、MBPP 以及 MMLU 等多项测试中,其得分均超越或持平于 Gemma 27B、Mistral-3.2-24B 以及 Qwen3-30B 等同级距模型。特别是在程式码与逻辑推理方面,Sarvam-30B 展现了...