xy3 在 python测试国内常用大模型输出速度中发帖由于个人比较常用智谱和字节的，所以这里目前只测了这两个测速结果：首token速度似乎都差不多，完整输出速度doubao-seed-1-6-flash-250715最快

xy3 在 python测试国内常用大模型输出速度中发帖

由于个人比较常用智谱和字节的，所以这里目前只测了这两个 
测速结果： 
首token速度似乎都差不多，完整输出速度doubao-seed-1-6-flash-250715最快。 
glm-4.5-flash这个轻量模型速度比较慢是我没想到的 




平台
模型
首token速度 (s)
Streaming token速度 (Chars/s)
Non-Streaming token速度 (Tokens/s)
Notes




智谱
glm-4.5
1.3390
39.93
29.43



智谱
glm-4.5-air
1.1415
48.52
35.10



智谱
glm-4.5-airx
1.2605
31.74
24.62



智谱
glm-4.5-flash
1.2539
31.77
15.12



智谱
glm-4.5-x
1.1274
38.73
33.65



火山
...