(@Myqwn2729) 在 cursor 试用 o1-mini 掺假 中发帖
测试问题2 来源:【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力
正确答案应该是 6528
尝试超过5次,都无法正确回答,而且答案多次变动。
截图是 cursor2api 到openwebui:
[image]