Nagi-ovo 在 做了一个有 Fable 5 的模型 PK 平台 中发帖
做了一个像 LMSYS ARENA 一样的 LLM PK 站,集齐了 48 个模型 + Harness 组合,目的很简单,就是想让大家直观对比下各家 Agent 的效果。
正好昨天 Fable 5 刚回归,欢迎大家快来看看这个 Fable 5 到底是什么样子,你能不能在这些模型的 1v1 PK 里面选出 Fable 5?它真的有传说中那么好吗?(当然这几个测评案例≠实战能力,不过也能可见一斑)
非推广,就是一个娱乐项目,发在这个分区应该没问题吧?(保险起见我还没发链接) 😀