sunss (@sssun) 在 好像国产开源模型全是瞎子? 中发帖
包括deepseek3.2,qwen3max,qwen3coder,MM2,K2,GLM4.6等等国产开源旗舰模型,全是瞎子,没有多模态,不支持识图。
qwen-vl,GLM-air 等次级模型倒是有识图。但是为什么不整合到旗舰模型上面去呢?
好像国产模型识图做的比较好的只有豆包?但是豆包是个闭源的而且智商堪忧。
国外的gpt,gemini ,claude ,grok的旗舰模型全是多模态。
到底是什么原因导致国内的模型多模态做的这么差?有没有佬分析一下?
感觉不要求你多模态做的有多牛逼了,起码要有这样一个功能吧,连图片上传对话都做不到,感觉体验还是很差的?