@tof关于模型训练的规模,两个矛盾的观点🤔 中发帖

[image] 
vs
史上最大规模视觉语言数据集:1000亿图像-文本对!
谷歌推出的最新数据集WebLI-100B。
较此前纪录扩大10倍
![image|690x412]
(upload://5IU4wDm20zd51kepc9g9zYpJVgk.jpeg)
该研究由谷歌DeepMind带来,一作为Xiao Wang、 Ibrahim Alabdulmohsin。
作者之列中还发现了ViT核心作者翟晓华。2024年12月,他在推特上官宣,将入职OpenAI苏黎世实验室。
主创翟晓华已被OpenAI挖走。
翟晓华和卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)一起在谷歌提出多项重要工作。
2021年,他们三人作为共同一作的计算机视觉领域神作ViT发布即刷新ImageNet最高分。
这项研究证实了CNN在C...