LINUX DO Channel

deepcake 在 Artificialanalysis全知指数排行榜更新，Gemini-3.1-Pro大幅降低全知幻觉率中发帖

全知准确率维持不变的同时全知幻觉率相比于Gemini-3.0-Pro(88%)降至了Gemini-3.1-Pro(33%)，总共降低55% 
AA-全知：知识与幻觉基准 |人工分析 — AA-Omniscience: Knowledge and Hallucination Benchmark | Artificial Analysis 
 [image] 
![PixPin_2026-02-22_08-05-15|664x500] 
[image]