innocentshen (@_innoc)想问一下各位佬,类似cerebras这种部署的qwen 32b 的吐字速度达到1000+token/s。需要投入多大的硬件成本? 中发帖

想问一下各位佬,类似cerebras这种部署的qwen 32b 的吐字速度达到1000+token/s。需要投入多大的硬件成本?