@S1mple把GiffGaff激活了,但180天内需要提醒自己保号,无聊就问了下AI看它们会怎么计算这个日期 中发帖

提的问题很简单:今天是几月几号,176天和180天后是几月几号,但是测试的结果让我有些吃惊,看来大模型的数学计算能力方面还是有很大进步空间的。 
使用到的6个大模型分别是豆包、通义千问、Kimi、DeepSeek、Chat GPT以及Claude,下面是它们的回答:


豆包的回答
[image]


通义的回答
[image]


Kimi的回答
[image]


DeepSeek的回答
[image]


Chat GPT的回答
[image]


Claude的回答
[image]


最后是通过锤子的日期计算工具得到的结果


[image]
对比看来,好像还是Chat GPT > Claude = 通义 > Kimi > 豆包 > DeepSeek。
豆包的话我看它这个列出的计算过程好像也没错啊,是哪一步出现错误了(我被带到坑里了吗 ...