@aepax 在关于gemini2.5pro 和0605,我的代码深度测试评价是中发帖结论仅仅测试了编程方面的水平,先说结论:0605的对于复杂项目的理解目前没有吹嘘那么高的提升,一定程度上甚至不如原有的2.5PRO.下面是碎碎念:最近在撸一些小玩具,在0605发布后就进行了测试,因为0605目前的热点事对于复杂架构的项目也能有非常强力的code水平. 测试方法我使用了原先的2.5pro(官网页面的)和aistudio里面的0605,让他们针对同一项目(文件塞过去后大概5W的token消耗)进行BUG审计,在另一个窗口进行现有某一功能的优化思路设计(该实验进行了多次,下面仅仅用一次的实例进行展示),并且会把回复的内容交给另一AI进行审计评价,同时会明确告诉AI直接的竞争关系. 首先是BUG审计方面首先是官网原先的回复 [image] 然后是0605的回复 [image] 可以看到0605提出了他认为的BUG的点,现在我将0605的回复提交给了官网2.5...

@aepax 在关于gemini2.5pro 和0605,我的代码深度测试评价是中发帖

结论
仅仅测试了编程方面的水平,先说结论:0605的对于复杂项目的理解目前没有吹嘘那么高的提升,一定程度上甚至不如原有的2.5PRO.
下面是碎碎念:最近在撸一些小玩具,在0605发布后就进行了测试,因为0605目前的热点事对于复杂架构的项目也能有非常强力的code水平. 
测试方法
我使用了原先的2.5pro(官网页面的)和aistudio里面的0605,让他们针对同一项目(文件塞过去后大概5W的token消耗)进行BUG审计,在另一个窗口进行现有某一功能的优化思路设计(该实验进行了多次,下面仅仅用一次的实例进行展示),并且会把回复的内容交给另一AI进行审计评价,同时会明确告诉AI直接的竞争关系. 
首先是BUG审计方面
首先是官网原先的回复 
 [image] 
然后是0605的回复
 [image] 
可以看到0605提出了他认为的BUG的点,现在我将0605的回复提交给了官网2.5...