TerryFlatley最近字节势头很猛,恐怖如斯开源也少不了他 中发帖

今年真的能看出字节在Openai和谷歌发布某一项新模型和技术后,字节可快速将他们独有的某一个卖点快速整合 
我对字节的技术响应力感到“离谱”:tieba_027:
比如gemini、openai的原生态局部编辑,openai发布不到两天,字节快速进行了技术响应并快速整合进自己的模型中
比如最近的o3可以输入图片思考,当天发布当天就开放了他们的豆包Doubao-1.5-thinking-pro的思维模型一样可以进行图片思考
结合他们最近发开源的模型,就不言而喻了
1.统一多模态模型

官方介绍:
我们提出了 Liquid,一种无缝集成视觉理解和生成的自回归生成范式。
与之前的多模态大型语言模型 (MLLM) 不同,Liquid 使用单个大型语言模型 (LLM) 实现这种集成,从而无需外部预训练的视觉嵌入(例如 CLIP)。



2.原生智能体

UI-TARS-1.5 是...