远方大大 (@jijin) 在 用小学数学题检测AI智商,大部分都回答不对 中发帖
image|690x479这是娃昨天晚上的作业,我发现是AI智商检测器,我试了国内外很多AI大部分是错的,甚至离谱。要么是考虑不到实际可浸入的高度限制,而不是整个铁块的高度(claude)或者只考虑到浸没的底面积而未考虑侧面积(mistral),豆包是没考虑到溢出部分的液体体积而且死不承认自己做错了直到今天才纠正过来,讯飞也回答错了,国产的那个智谱清言更夸张,刚开始做错了然后我纠正过来,然后又给了一个错误的答案更新答案结果它竟然又回答新答案是对!
[image]
[image]
[image]