miaomiao0415佬们有没有一些简单的想法检测中转站掺水 中发帖

最近在看了一些LLM安全的论文,他们检测掺水都需要真模型的全量参数(这肯定是不可能的)。 
有官方api的输出和有中转站的输出,又得保证输入不能太长样本不能太多(不然在整个数据集下跑完钱都烧没了)。这种情况下是不是其实比较难检测。
有一个简单的理论,掺水的在输入->输出->还原输入->输出 这种情况下 信息损失会比不掺水的严重多。不知道这个假设对不对