LINUX DO Channel

下班打卡 - 早退 (@jjsc) 在 Gemini吊打其他！做了一个AI自讨论的MCP，试用下来然后发现不同的模型调用模型的能力差异和表现真的很大中发帖

既然大模型都是个抽奖，所以我一直是希望大模型输出之后有个自审核，ok再输出。所以一直在琢磨这个MCP。今天再改了一下。大概流程就是先 2个AI角色根据我的要求先PK 几轮，然后再一个角色将讨论的结果总结，然后再一个角色进行评分，评分达标就提交审核，审核又是双角色审核机制，最后OK了才输出结果。 
说起来流程有点复杂，这个就有点考验模型的多次调用工具的能力了。然后就，用chatwise来测试，然后就发现非常有趣的结果了。一些模型，是在一个对话里面，不停的调用能力。一些模型，实际上是变成了多次自动对话，在这个过程调用能力。差别还真是很大。 
Gemini 和 deepseek的形式和其他是不一样的，是我喜欢的方式。当然，Gemini的方式我更喜欢。 
然后流程遵循方面，Gemini的遵循是真的好。而现在这些国内的模型，基本都跳过了我设定的部分流程，都还有巨大的改进空间…… 
——– 
Gemi...