@luxury 在 由claude mythos引发的一些思考 中发帖
看各种新闻说claude mythos在网安能力上有显著性的突破,因为太危险先不开放出来。
我首先想了想这是不是真的,然后觉得也有可能。
因为找漏洞这个任务目标很明确,好设计RL。
接着这个思路是不是其他一些目标明确好设计RL的方向也可以有新的提高
相比之下画个前端这种东西的评判就很和主观审美相关,(额外吐槽一下各家科技媒体评测各个模型都是让画个网页出来,然后逮着新的模型一顿吹)