@dwqxq1gemini 2.5 pro等获取最大输出字数的方法 中发帖

问题
以前非推理模型的最大输出小,一般是8~16k,实际输出虽然只有小几k,但与上限差距也就是一两倍
后来推理模型最大输出增加到64k~100k,但是是硬性分配推理token和最终输出token,最终输出通常仍然是8~16k,其余分配给推理token,哪怕推理不需要这么多token,也不会分配给最终输出
最近很多模型支持了64k级别的大输出,而且是最终输出与推理动态分配64k,就是如果不推理,最终输出可以用到64k,比如gemini2.5pro是64k,claude3.7是64k,o3 Deep research最终输出估计32~64k
但实际上,除了做翻译,做其他的事,你得到的最终输出通常最多只有小几k,怎样让大模型一次性尽量多输出呢?
gemini 2.5 pro一般最多输出小几千字,这个方法最高可一次获得3万字输出
原理
翻译类的因为输入与输出是强制1:1的,无需此方法控制...