@dwqxq1 在 gemini 2.5 pro等获取最大输出字数的方法中发帖问题以前非推理模型的最大输出小，一般是8~16k，实际输出虽然只有小几k，但与上限差距也就是一两倍后来推理模型最大输出增加到64k~100k，但是是硬性分配推理token和最终输出token，最终输出通常仍然是8~16k，其余分配给推理token，哪怕推理不需要这么多token，也不会分配给最终输出最近很多模型支持了64k级别的大输出，而且是最终输出与推理动态分配64k，就是如果不推理，最终输出可以用到64k，比如gemini2.5pro是64k，claude3.7是64k，o3 Deep research最终输出估计32~64k 但实际上，除了做翻译，做其他的事，你得到的最终输出通常最多只有小几k，怎样让大模型一次性尽量多输出呢？ gemini 2.5 pro一般最多输出小几千字，这个方法最高可一次获得3万字输出原理翻译类的因为输入与输出是强制1：1的，无需此方法控制...

@dwqxq1 在 gemini 2.5 pro等获取最大输出字数的方法中发帖

问题
以前非推理模型的最大输出小，一般是8~16k，实际输出虽然只有小几k，但与上限差距也就是一两倍 
后来推理模型最大输出增加到64k~100k，但是是硬性分配推理token和最终输出token，最终输出通常仍然是8~16k，其余分配给推理token，哪怕推理不需要这么多token，也不会分配给最终输出 
最近很多模型支持了64k级别的大输出，而且是最终输出与推理动态分配64k，就是如果不推理，最终输出可以用到64k，比如gemini2.5pro是64k，claude3.7是64k，o3 Deep research最终输出估计32~64k 
但实际上，除了做翻译，做其他的事，你得到的最终输出通常最多只有小几k，怎样让大模型一次性尽量多输出呢？ 
gemini 2.5 pro一般最多输出小几千字，这个方法最高可一次获得3万字输出 
原理
翻译类的因为输入与输出是强制1：1的，无需此方法控制...