Bunn (@BunnHack) 在挑战全球 AI 巨头！印度公司 Sarvam AI 发表 30B 与 105B 大模型，接近国内Qwen3和GLM 4.5 Air的水平中发帖印度人工智慧新创公司 Sarvam AI 近日于技术峰会上正式亮相其最新研发成果，推出两款重量级大型语言模型：Sarvam-30B 与 Sarvam-105B

Bunn (@BunnHack) 在挑战全球 AI 巨头！印度公司 Sarvam AI 发表 30B 与 105B 大模型，接近国内Qwen3和GLM 4.5 Air的水平中发帖

印度人工智慧新创公司 Sarvam AI 近日于技术峰会上正式亮相其最新研发成果，推出两款重量级大型语言模型：Sarvam-30B 与 Sarvam-105B。并声称纯自研(从零开始打造LLM) 
 [HBbFzwEbcAANCrk] 
作为本次发表的亮点之一，Sarvam-30B 模型在训练规模上达到了 16 兆（16T）Tokens。这使得该模型在理解语言细微差别与知识广度上具有极佳表现。 

技术规格： 拥有 32k tokens 的上下文窗口（Context Length）。
基准测试表现： 根据官方公布的数据，Sarvam-30B 在 Math500、HumanEval、MBPP 以及 MMLU 等多项测试中，其得分均超越或持平于 Gemma 27B、Mistral-3.2-24B 以及 Qwen3-30B 等同级距模型。特别是在程式码与逻辑推理方面，Sarvam-30B 展现了...