@tof 在关于模型训练的规模，两个矛盾的观点🤔 中发帖[image] vs 史上最大规模视觉语言数据集：1000亿图像-文本对！谷歌推出的最新数据集WebLI-100B

@tof 在关于模型训练的规模，两个矛盾的观点🤔 中发帖

[image] 
vs 
史上最大规模视觉语言数据集：1000亿图像-文本对！ 
谷歌推出的最新数据集WebLI-100B。 
较此前纪录扩大10倍 
![image|690x412] 
(upload://5IU4wDm20zd51kepc9g9zYpJVgk.jpeg) 
该研究由谷歌DeepMind带来，一作为Xiao Wang、 Ibrahim Alabdulmohsin。 
作者之列中还发现了ViT核心作者翟晓华。2024年12月，他在推特上官宣，将入职OpenAI苏黎世实验室。 
主创翟晓华已被OpenAI挖走。
翟晓华和卢卡斯·拜尔（Lucas Beyer）、亚历山大·科列斯尼科夫（Alexander Kolesnikov）一起在谷歌提出多项重要工作。 
2021年，他们三人作为共同一作的计算机视觉领域神作ViT发布即刷新ImageNet最高分。 
这项研究证实了CNN在C...