维ABC (@WABC) 在智源研究院“百模”评测结果：字节跳动多项第一大厂AI整体领先中发帖近日，智源研究院发布国内外100余个开/闭源语言、视觉语言、文生图、文生视频大模型综合及专项评测结果

维ABC (@WABC) 在智源研究院“百模”评测结果：字节跳动多项第一大厂AI整体领先中发帖

近日，智源研究院发布国内外100余个开/闭源语言、视觉语言、文生图、文生视频大模型综合及专项评测结果。评测发现，2024年下半年，大模型发展更聚焦综合能力提升与实际应用。多项评测结果中，字节跳动多项AI能力领先，阿里巴巴、百度等大厂派AI均取得优异表现。 

据评测结果，针对一般中文场景的开放式问答或生成任务，语言模型能力已趋于饱和稳定，但是复杂场景任务的表现，国内头部语言模型仍然与国际一流水平存在显著差距。在中文能力理解上，字节跳动Doubao-pro-32k-preview、百度ERNIE 4.0 Turbo位居第一、第二，OpenAI o1-preview-2024-09-12、Anthropic Claude-3-5-sonnet-20241022位列第三、第四，阿里巴巴Qwen-Max-0919排名第五。 
 [图片] 
在视觉语言多模态模型能力评测结果中，一些较好的开源模型在...