jam1024 (@geekjam) 在 AI 简单的时间测试 中发帖
测试使用的prompt
当前时间的json是{“year”:2025,“month”:3,“day”:17},那么下周五的json是多少
第二个测试prompt,2个论测以避免缓存和观测加入请问是否会导致不同的结果,或者温度是否会导致不同结果
当前时间的json是{“year”:2025,“month”:3,“day”:17}, 请问那么下周五的json是多少
gpt4o-mini 大概率翻车 (温度调0不翻车)
gpto3-mini 未翻车
Deepseek 671 偶尔翻车 (温度调0不翻车)
DeepSeek-R1-Distill-Qwen-32B 翻车 (调节温度无效)
QwQ32b 过度思考+翻车 (调节温度无效)
Gemini Flash 2.0 翻车 (调节温度无效)
Gemini Flash Lite 2.0 Preview 翻车 (调节温度无...