Cybertronmt 在 Qwen3.5 核心指标曝光 中发帖
Qwen3.5 已经提了 PR,这样网友就可以一窥其架构了。目前来看,用了混合注意力,并且是带有视觉理解能力的模型。模型已上线 Arena,过几天就能看到实测水平了
[image]
Qwen3.5 已经提了 PR,这样网友就可以一窥其架构了。目前来看,用了混合注意力,并且是带有视觉理解能力的模型。模型已上线 Arena,过几天就能看到实测水平了
[image]