Sol (@Frank_Frank_Lewuder)OpenAI 与 Anthropic 联手研究幻觉与越狱问题 中发帖

[image] 
Anthropic 网站
摄影师:Gabby Jones/Bloomberg
作者:Rachel Metz
August 28, 2025 at 12:06 AM GMT+7
OpenAI 和 Anthropic 作为人工智能领域两大主要竞争对手,近期互相评估对方模型,旨在更好地理解自身测试可能遗漏的问题。
周三,OpenAI 和 Anthropic 在各自的博客上发表帖子称,今年夏天他们对方公司公开发布的 AI 模型进行了安全评估。他们还测试了模型编造事实的倾向以及错位问题,错位是一个常用术语,指 AI 模型没有按照其开发者的期望行事。
这两家公司是备受瞩目的竞争对手——Anthropic 由前 OpenAI 员工创立——因此这次合作引人注目。OpenAI 将联合安全工作称为“首次跨实验室安全与对齐测试的重大行动”,并补充说该小组希望这将为“评估行业安全提...