@Zigzag有什么比较便宜的方法能用到 1000token/s 的模型? 中发帖

之前领了小米的 50 块钱额度,申请了小米 mimo ultraspeed 的试用。 
在 hermes 配置了一下,惊为天人,太快了,1000 token/s,几乎输入立刻就看到结果。瓶颈只在主机性能上,可惜还是有点贵,哪怕开小米的 plan 也不便宜啊,有没有类似的便宜一点的方案。