TOTDeepseek在今天下午故障1小时后,似乎首字延迟和响应速度更快了。 中发帖

结论:  DS扩卡了

数据来部门内部New-api,接入Deepseek官方API,所有统计均限为Deepseek-v4-pro模型


Token生成速度未变化,33.4tok/s vs 33.7tok/s
缓存命中率 97.9% vs 98.6%
响应时间降低约 40% ~ 50%
首字延迟降低约 56% ~ 76%

以下为使用Deepseek V4 Pro max调用newapi数据库进行的分析。
在无缓输入、缓存命中输入、输出均增加的情况下,响应和延迟还大幅优化了。
[图片]
[图片]
[图片]