erkw (@zzzx9)高推理速度的Qwen2.5-Coder-32B和Qwen2.5-72B api 中发帖

https://cloud.sambanova.ai/apis 高速度的Qwen2.5-72B-Instruct和Qwen2.5-Coder-32B-Instruct,可以用于沉浸式翻译,20rpm 
沉浸式调成最大token 2600,最大段落1000 ,体验很好