TOT 在 Deepseek在今天下午故障1小时后，似乎首字延迟和响应速度更快了

TOT 在 Deepseek在今天下午故障1小时后，似乎首字延迟和响应速度更快了。中发帖

结论:  DS扩卡了

数据来部门内部New-api，接入Deepseek官方API，所有统计均限为Deepseek-v4-pro模型 


Token生成速度未变化，33.4tok/s vs 33.7tok/s
缓存命中率 97.9% vs 98.6%
响应时间降低约 40% ～ 50%
首字延迟降低约 56% ～ 76%

以下为使用Deepseek V4 Pro max调用newapi数据库进行的分析。 
在无缓输入、缓存命中输入、输出均增加的情况下，响应和延迟还大幅优化了。 
 [图片] 
 [图片] 
 [图片]