@ratingeater 在 你的测试题真的能够稳定识别gpt模型吗 中发帖
本帖旨在收集广大坛友的测试题,prompt和思路,从而实现集思广益的效果
首先有关prompt,先分享一个由本人收集提示词进行优化的GPT4o(参考了某抽象prompt并引入链式思维),貌似有概率通过部分之前论坛大佬分享的测试问题,具体水平可以自测一下:
其次关于测试题,其实大多数模型的分辨方式论坛也能够找到,我这里提供一个从能力根源上分辨o1-mini的题目(由于现在没有数学比o1mini强的模型,所以这些原创题其他模型一定无法回答):
最后,还是让我们膜拜一下o1-mini无敌的数学计算能力吧(注:以下题均为原创,其中最后一题ab/c=1的情况其实需要舍去,但这都不重要了):
[5e3b32d5f4e9cf86f7eccd0175c14ef]
[b9e8af8fb81a2c3950f0fa68337e4cc]
[ee508a791c635e265e55d867a581...