变色龙 (@bianselong) 在 前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型 中发帖
胡瀚是计算机视觉领域的重要研究者,他曾以核心作者身份参与论文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的创作。
Swin Transformer 性能优于 DeiT、ViT 和 EfficientNet 等主干网络,已经替代经典的 CNN 架构,成为了计算机视觉领域通用的 backbone(IT之家注:backbone 是指一种在神经网络或机器学习模型中常用的基本结构或骨架)。
去年 9 月,腾讯正式发布新一代大模型 —— 腾讯混元 Turbo。据腾讯官方介绍,该模型采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。
去年 12 月,腾讯宣布混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。 消息称前微软亚研院视觉专家胡瀚加入腾讯...