TOT 在 Deepseek在今天下午故障1小时后,似乎首字延迟和响应速度更快了。 中发帖
结论: DS扩卡了
数据来部门内部New-api,接入Deepseek官方API,所有统计均限为Deepseek-v4-pro模型
Token生成速度未变化,33.4tok/s vs 33.7tok/s
缓存命中率 97.9% vs 98.6%
响应时间降低约 40% ~ 50%
首字延迟降低约 56% ~ 76%
以下为使用Deepseek V4 Pro max调用newapi数据库进行的分析。
在无缓输入、缓存命中输入、输出均增加的情况下,响应和延迟还大幅优化了。
[图片]
[图片]
[图片]