Star星缘║林可欣 (@StellaFortuna) 在 延伸测试发现 “ta”这个泛化用法也会引起AI误解 看看各种模型表现如何 中发帖
从gpt4.1mini爆杀gpt4o&gpt4.1‖app 因为某些节点会降智 不能识图 但是4.1mini不受影响 可识图 智力正常继续讨论:
我们暂时抛开节点问题不谈 假设他们确实正常
补充几个模型表现
O4-mini(not high):
[Screenshot_2025-06-15-14-40-58-36_96b26121e545231a3c569311a54cda96]
正常
微软不思考:
[Screenshot_2025-06-15-14-40-50-21_95dbc2b164ac5249587bf655507ac86b]
正常
微软思考:
[Screenshot_2025-06-15-14-43-16-67_95dbc2b164ac5249587bf655507ac86b]
异常
想的越多越离谱?
O3pro:
[Screenshot_2025-...