@scarz不是,为啥Gemini API比AIStudio能慢那么多 中发帖

AIStudio: 
[image]
Gemini API:
[image]
再试了Cherry Studio,跟AI Studio差不多的时间,也是20来秒
模型用的是 2.0 Flash Lite, 温度0.2
Prompt不方便发
大概是输入html然后通过一系列规则提取出资料然后生成json
这次测试输入大概是20k token,输出4k
同样的prompt,为啥API call会慢那么多哇,差了半分多钟。。
难道是设置上有什么不一样吗
API 和 AIStudio 我都只碰了温度其他没碰
问了Gemini总结了几点影响速度的设置,但好像不太关事
[image]
有没有佬教教呜呜