MIKUSCAT对于由Gemini3系列驱动的deep research系列,如何压制其幻觉率? 中发帖

总所周知,Gemini 3 pro preview目前采用滑动窗口注意力,在32K内是神,32K外是区,而3 flash虽然注意力好,但是懒,不愿意输出,内容深度也比Gemini 3 pro preview差一点。 
现在我做的一个deepresearch,类似于skills和subagent的结合体吧,用的原生Gemini搜索和URL fetch,我让它研究一下Claude-opus-4-5,结果在报告里竟然给我说Gemini 3 pro系列上下文为2W?按理说谷歌做搜索起家的,这种低级错误是真的不该犯啊。以及,要不是我一直强调现在时间,Gemini 3 pro总是给我研究Claude-opus-3-5,说什么也不愿意承认有opus-4-5的存在。
我本来想利用Gemini deep thinkIMO金牌的经验,让其有一个审查器来再次确认和检索,打回重新搜索来着,结果本来对的又给我改...