道友 (@jinglei)据说DeepSeek V4泄露数据,显示排行榜里它现在是第一 中发帖

[0deb2c30b40502e8efb76c09cf4133ac] 
据说DeepSeek V4泄露数据显示,SWE-bench Verified测试83.7%,超过Claude Opus 4.5(80.9%)和GPT-5.2(80%),100万+上下文能全仓库推理~排行榜里它现在是第一,不过数据是泄露的,官方还没确认。