@ABcopilotGemini 3 pro preview个人使用体感2 - 稍长上下文的处理能力好像没我想象的差 中发帖

之前发了一个初步体感,里面提到Gemini 3(pro preview,下面简称3,下文2.5pro也简称2.5)个人体验“智商”算是在线,讨论科研类问题时能提供准确认知和有价值的建议,不过语言表达风格有所精炼。总的来说还是有使用价值。 

不过当时并没有体验长上下文的情况,都是有限的几轮问答,最多也没超过15k。后来看很多佬友提到Gemini 3 pro preview在处理长上下文时有比较严重的性能衰减问题,比2.5都有所退步,很多佬友还做了量化的测试,这个佬友这里总结得很全:

总结各位佬友的结论就是其黄金性能区间大概就30-50k,比2.5有2-3倍的差距。但我今天用Gemini 3尝试了几个长文处理的任务(渠道:ai studio网页版),似乎体验倒没有佬友们说的那么差?不过我的任务类型和佬友们比较有代表性的大海捞针测试任务还是有一点差别,我的任务主要是:

小说总结和提炼任...