下班打卡 - 早退 (@jjsc) 在 Gemini吊打其他!做了一个AI自讨论的MCP,试用下来然后发现不同的模型调用模型的能力差异和表现真的很大 中发帖
既然大模型都是个抽奖,所以我一直是希望大模型输出之后有个自审核,ok再输出。所以一直在琢磨这个MCP。今天再改了一下。大概流程就是先 2个AI角色根据我的要求先PK 几轮,然后再一个角色将讨论的结果总结,然后再一个角色进行评分,评分达标就提交审核,审核又是双角色审核机制,最后OK了才输出结果。
说起来流程有点复杂,这个就有点考验模型的多次调用工具的能力了。然后就,用chatwise来测试,然后就发现非常有趣的结果了。一些模型,是在一个对话里面,不停的调用能力。一些模型,实际上是变成了多次自动对话,在这个过程调用能力。差别还真是很大。
Gemini 和 deepseek的形式和其他是不一样的,是我喜欢的方式。当然,Gemini的方式我更喜欢。
然后流程遵循方面,Gemini的遵循是真的好。而现在这些国内的模型,基本都跳过了我设定的部分流程,都还有巨大的改进空间……
——–
Gemi...