innocentshen (@_innoc) 在 想问一下各位佬,类似cerebras这种部署的qwen 32b 的吐字速度达到1000+token/s。需要投入多大的硬件成本? 中发帖
想问一下各位佬,类似cerebras这种部署的qwen 32b 的吐字速度达到1000+token/s。需要投入多大的硬件成本?
想问一下各位佬,类似cerebras这种部署的qwen 32b 的吐字速度达到1000+token/s。需要投入多大的硬件成本?