知秋意 (@zhiqiuyi) 在 国内有多模态全能型大模型吗 中发帖
国外的一些模型,像 gemini 2.5 pro,同时支持图片、视频、音频,我看国内的一些模型,像 doubao,xxx-vision 只支持图片,xxx-audio 只支持音频,没有大一统的模型吗。
国外的一些模型,像 gemini 2.5 pro,同时支持图片、视频、音频,我看国内的一些模型,像 doubao,xxx-vision 只支持图片,xxx-audio 只支持音频,没有大一统的模型吗。