CarlxlxGemini-2.0-flash-exp:最适合日常使用的视觉识别大模型,包含实际测试结果 中发帖

现在gemini-2.0-flash-exp推出,从命名上也能看出正式版已经不远了,到时候应该没啥大改动,因此这次测试应该是对gemini-2.0-flash最有效的一次 
也别看我这敲字了,直接上结果
对于普通的图片
[tem1cn]
看起来前几个exp版本基本都是为flash做铺垫呢,这么一比1.5 pro简直没法看
对于其它厂商的,这次我就没必要测了,之前曾经试过

除了普通图片,日常使用的重中之重其实是文字OCR,测试表明提升也非常大
[tem2cn]
个人认为,这里面2.0 flash应该是最好的
如果涉及到英文的话,效果更佳
[默认话题]
其中只识别错了两个字母(gin->gum),日常使用基本上没啥问题
不过最后我要强调,为啥说2.0 flash是日常使用的最佳视觉模型呢?主要是价格和响应速度
[tem4]
一天免费1500次,4秒钟一次,要...