xy3python测试国内常用大模型输出速度 中发帖

由于个人比较常用智谱和字节的,所以这里目前只测了这两个 
测速结果:
首token速度似乎都差不多,完整输出速度doubao-seed-1-6-flash-250715最快。
glm-4.5-flash这个轻量模型速度比较慢是我没想到的




平台
模型
首token速度 (s)
Streaming token速度 (Chars/s)
Non-Streaming token速度 (Tokens/s)
Notes




智谱
glm-4.5
1.3390
39.93
29.43



智谱
glm-4.5-air
1.1415
48.52
35.10



智谱
glm-4.5-airx
1.2605
31.74
24.62



智谱
glm-4.5-flash
1.2539
31.77
15.12



智谱
glm-4.5-x
1.1274
38.73
33.65



火山
...