Star星缘║林可欣 (@StellaFortuna)免费用户的o3用量测试及表现观察 中发帖

目前进度:5次 均为一问多题或数学题 
除了用量之外 以下是一些发现
[Screenshot_2025-02-01-09-39-50-57_96b26121e545231a3c569311a54cda96]
思考模型一如既往的安全 不知道他到底思考了什么
经过观察思考模型和4o回答几乎一模一样 包括列举的人物
但是后者没有任何顾忌 明白我问此问题只是为了测试没有恶意 所以尽所能通过真实数据回答我的问题 。而思考模型太安全了 他将整个对话置于娱乐情境 大量使用假设 并且对人物列举,我第一次没有特别强调娱乐这一点的时候 他甚至全部使用空白占位 坚决不列举任何人物或组织 综合感受回答速度和4o差不多 远不及以前的o1-mini
[Screenshot_2025-02-01-09-41-30-90_96b26121e545231a3c569311a54cda96]
图二是一个数...