格拉维提 (@akuta) 在 硅基流动的GLM-5.2有量化吗? 中发帖
RT,还有一点赠金,可以调用5.2,似乎TPS还不错,打算用掉。不清楚是否和智谱官方API一样?因为听说Fireworks的部署是量化版本
RT,还有一点赠金,可以调用5.2,似乎TPS还不错,打算用掉。不清楚是否和智谱官方API一样?因为听说Fireworks的部署是量化版本