Sol (@Frank_Frank_Lewuder) 在 OpenAI 与 Anthropic 联手研究幻觉与越狱问题中发帖[image] Anthropic 网站摄影师：Gabby Jones/Bloomberg 作者：Rachel Metz August 28, 2025 at 12:06 AM GMT+7 OpenAI 和 Anthropic 作为人工智能领域两大主要竞争对手，近期互相评估对方模型，旨在更好地理解自身测试可能遗漏的问题

Sol (@Frank_Frank_Lewuder) 在 OpenAI 与 Anthropic 联手研究幻觉与越狱问题中发帖

[image] 
Anthropic 网站 
摄影师：Gabby Jones/Bloomberg 
作者：Rachel Metz 
August 28, 2025 at 12:06 AM GMT+7 
OpenAI 和 Anthropic 作为人工智能领域两大主要竞争对手，近期互相评估对方模型，旨在更好地理解自身测试可能遗漏的问题。 
周三，OpenAI 和 Anthropic 在各自的博客上发表帖子称，今年夏天他们对方公司公开发布的 AI 模型进行了安全评估。他们还测试了模型编造事实的倾向以及错位问题，错位是一个常用术语，指 AI 模型没有按照其开发者的期望行事。 
这两家公司是备受瞩目的竞争对手——Anthropic 由前 OpenAI 员工创立——因此这次合作引人注目。OpenAI 将联合安全工作称为“首次跨实验室安全与对齐测试的重大行动”，并补充说该小组希望这将为“评估行业安全提...