oguri (@wiwuwiwu) 在 deepseek v3 0324这幻觉率。。。 中发帖
HHEM-2.1幻觉评估模型 03-25更新的榜单
[Snipaste_2025-03-26_18-36-13]
gemini 2.5 pro才1.1%
[Snipaste_2025-03-26_18-35-40]
deepseek好家伙。。。太离谱了