Star星缘║林可欣 (@StellaFortuna) 在免费用户的o3用量测试及表现观察中发帖目前进度:5次均为一问多题或数学题除了用量之外以下是一些发现 [Screenshot_2025-02-01-09-39-50-57_96b26121e545231a3c569311a54cda96] 思考模型一如既往的安全不知道他到底思考了什么经过观察思考模型和4o回答几乎一模一样包括列举的人物但是后者没有任何顾忌明白我问此问题只是为了测试没有恶意所以尽所能通过真实数据回答我的问题

Star星缘║林可欣 (@StellaFortuna) 在免费用户的o3用量测试及表现观察中发帖

目前进度:5次 均为一问多题或数学题 
除了用量之外 以下是一些发现 
 [Screenshot_2025-02-01-09-39-50-57_96b26121e545231a3c569311a54cda96] 
思考模型一如既往的安全 不知道他到底思考了什么 
经过观察思考模型和4o回答几乎一模一样  包括列举的人物 
但是后者没有任何顾忌 明白我问此问题只是为了测试没有恶意 所以尽所能通过真实数据回答我的问题 。而思考模型太安全了 他将整个对话置于娱乐情境 大量使用假设  并且对人物列举，我第一次没有特别强调娱乐这一点的时候 他甚至全部使用空白占位 坚决不列举任何人物或组织  综合感受回答速度和4o差不多 远不及以前的o1-mini 
[Screenshot_2025-02-01-09-41-30-90_96b26121e545231a3c569311a54cda96] 
图二是一个数...