cat3399 在 最快的glm4.6-cerebras 中发帖
[image]
但是不及预期啊,怎么连1k tps都没达到,而且差这么多,同平台的qwen coder日常都2k tps了
不过用起来感觉智商挺在线,应该没阉割太严重
目前没有免费方案,免费的得再等几天
[image]