deepcake 在 Artificialanalysis全知指数排行榜更新,Gemini-3.1-Pro大幅降低全知幻觉率 中发帖
全知准确率维持不变的同时全知幻觉率相比于Gemini-3.0-Pro(88%)降至了Gemini-3.1-Pro(33%),总共降低55%
AA-全知:知识与幻觉基准 |人工分析 — AA-Omniscience: Knowledge and Hallucination Benchmark | Artificial Analysis
[image]
![PixPin_2026-02-22_08-05-15|664x500]
[image]