@umbrella 在想到一种思维链防蒸馏的算法中发帖在输出思维链时，在v2w层后加一个随机偏移，偏移到另一个token，同时输出这个偏移值，要求在下一次推理的时候把偏移值数组也带回来

@umbrella 在想到一种思维链防蒸馏的算法中发帖

在输出思维链时，在v2w层后加一个随机偏移，偏移到另一个token，同时输出这个偏移值，要求在下一次推理的时候把偏移值数组也带回来。 
这样在下一次推理的时候服务侧就可以根据偏移后的token和偏移值反求原token，并且向用户隐藏了真正的思维链，只要v2w的算法没有被破解就是安全的。 
 [image] 
[image] 
不过想了想在乎思维链的厂商现在的策略是直接隐藏/用一个小模型概括思维链（gemini/gpt），所以可能这个方法也没什么实际价值，可以节省厂商缓存思维链或者概括的成本？ 
从这个方法发散，还可以想到两个使用场景： 


agent加密：如果AI面向的是agent这类偏向干活而不是聊天的用途，我们甚至可以将非思考部分也一起加密，只明文的本地工具调用和最终结果汇报。 


面向开源模型的中转站防窥，可以使用对称防中间人攻击的方式在源站和用户之间协商密钥，通过密钥生成偏移值...