@claude35 在 Arxiv 论文揭露Shadow API 的掉包套路 中发帖
Arxiv 上一篇非常有意思的论文 Real Money, Fake Models,专门审计了市面上大量的第三方“暗影 API”。
核心结论:
大规模掉包: 审计发现 45.83% 的 API 端点没通过指纹测试。你以为在用 GPT-5,后台可能跑的是 GLM-4 或者 DeepSeek-V3。
降级打击: 所谓的“思维模型”(如 DeepSeek-Reasoner)在很多代理里被换成了普通的 Chat 模型,导致 AIME 数学竞赛性能暴跌 40%。
经济收割: 论文总结了三种套路:信息溢价(高价卖低级模型)、折扣替换(原价卖开源模型)、倒卖加价。
学术污染: 最离谱的是,居然有 187 篇学术论文(包括 ACL、CVPR 顶会)是基于这些不靠谱的暗影 API 做的实验,研究结论的可靠性存疑。
论文里的黑科技识破手段:
LLMmap 指纹识别: 给每个模型验“DNA”。
M...