wyg (@wangyugui)抛砖引玉,国产ai测试,硅基流动 中发帖

最重要的说前面:我是小白,没技术,别喷,真的会哭。。。。。。
突发奇想,写个脚本(大部分功劳是cursor),测试以下硅基流动上的ai大模型哪个最好用,测试问题在网上和论坛里找的,不是原创。
测评结果 Qwen虐爆其他国产大模型,当然我的问题集很小众也很局限,期待大佬测出更全面的排名。
测试结果:
==================================================
测试结果汇总
==================================================

第 1 名: Qwen/Qwen2.5-72B-Instruct-128K
总分: 18/30
题目 1 得分: 0/3
回答记录: ['12.0', '12.0', '12.0']
题目 2 得分: 3/3
回答记录: ['B', 'B', 'B']
题目 3 得分: 3/3
...