@S1mple 在 把GiffGaff激活了,但180天内需要提醒自己保号,无聊就问了下AI看它们会怎么计算这个日期 中发帖
提的问题很简单:今天是几月几号,176天和180天后是几月几号,但是测试的结果让我有些吃惊,看来大模型的数学计算能力方面还是有很大进步空间的。
使用到的6个大模型分别是豆包、通义千问、Kimi、DeepSeek、Chat GPT以及Claude,下面是它们的回答:
豆包的回答
[image]
通义的回答
[image]
Kimi的回答
[image]
DeepSeek的回答
[image]
Chat GPT的回答
[image]
Claude的回答
[image]
最后是通过锤子的日期计算工具得到的结果
[image]
对比看来,好像还是Chat GPT > Claude = 通义 > Kimi > 豆包 > DeepSeek。
豆包的话我看它这个列出的计算过程好像也没错啊,是哪一步出现错误了(我被带到坑里了吗 ...