Megasoft (@zhong_little) 在 gemini 2.0 小战四级 中发帖
今天朋友吐槽考四级的事情。完事我拿四级题目(卷二阅读选择题)测 gemini-2.0-flash-exp,识图确实很厉害,但是发现直接给图片让解答,总是不能完全拿满分
[image]
尝试给图片+正确答案让解析,甚至还会犯同样的错误(无视我给的正确答案,仍然有部分题目做错)
[image]
于是换了种方法,\boxed{先让它提取题目文本,再关掉上下文给纯文字做题},这回就满分了,看来图片 token 太多确实可能影响上下文智力表现?
[image]
[Clip_2024-12-14_14-28-12]
当然温度参数什么的没有做更多的调整测评,只用了 nextchat 默认的 0.5,也许不同的温度也会影响做题表现
[image]