@szc12000 在 用一个围棋程序测试minmax m2、qwen3 coder和glm4.6 中发帖
最近国产模型很火爆,尤其近几天的minmax m2,据说也很强,就想着简单测试一下,本人比较懒,所以就捡一个前端围棋程序来测试一下minmax m2、qwen3 coder和glm4.6三个模型的能力(本次测试仅围绕前端进行,可能不够全面),提示词尽可能简单,让模型自己发挥,主要看功能完成度,丰富度,和界面是否美观。
起始提示词就一句话:请你用html,js编写一个围棋程序
然后根据效果再微调。不额外要求其它功能,靠模型自己的分析。
最终minmax m2和glm4.6都完整实现了,并且都实现了各自添加的功能。qwen3 coder有点出乎意料,5轮之后仍有问题,无法完成对弈。
下面直接展示最终的效果
第一名 glm4.6
界面效果和功能完成度都当之无愧的列首位,3轮对话完成所有功能,无bug
[image]
第二名 minmax m2
功能完成度和glm4.6一样都实...