@apparition 在 为啥 GLM 系列模型没有第三方高速提供商? 中发帖
嘛,刚刚原文不见了
打完的字删掉好可惜,重新开个头水水文 😋
首先,高速推理的御三家为 Cerebras, Groq, Sambanova (小气鬼?)
速度依序为 ~2000 Tok/s > 500~1500 Tok/s > ~300 Tok/s
目前 Cerebras 还是挺佛心的,可以组个号池用来翻译
回到原题,为啥 GLM 4.5 没有入选上架
我不是官方,不清楚他们的算盘
不过可以从时间序中看出一些东西
时间序
2025-01-20 幻方量化推出 Deepseek R1
2025-02-13 SambaNova 上架 DeepSeek R1
2025-04-29 阿里推出 Qwen 235B
2025-07-08 Cerebras 上架 Qwen 235B
2025-07-11 月之暗面推出 Kimi K2
2025-07-15 Groq 上架 Kimi...