后皇嘉树 (@Theigrams)一个小例子,简单测试各大模型的网页画图能力 中发帖

Prompt 就是给定一道数学题,然后用 HTML SVG 画一个示意图。 
测试不严谨,大伙大概看个乐就行。
省流:

GLM-5.1 和 Claude Opus 4.6 同属第一梯队,并且思考 token 少一半
GLM-5-turbo 比 GLM 5 强一些
GPT-5.4 拉完了


GLM 4.7

思考 3 秒
输出 tokens:4.9 k
总耗时:2m 30s
生成速度:32.6T/s(不知道为什么这么慢,理论上 4.7 平时很快的)

[image]
评价:基本上没思考,直接开始写,效果一般,问题很多。
打分:50 分
GLM 5

思考 15 秒
输出 tokens:5.4 k
总耗时:1m 46s
生成速度:50.9T/s

[image]
评价:美观程度有所上升,但是存在遮挡。
打分:60 分
GLM-5-turbo

思考 7 秒
输出 tok...