Neo 在 我们训练了一个特别的小模型 中发帖
佬友们好!
这个事情源自前段时间 Telegram 群里的一次讨论,大概意思就是中外技术大佬的头像问题。其中提到了一个由来已久的论点:我国的技术大佬大多数都是二次元头像,二次元程度越深,技术越强。
但我却有不一样的角度:一想到TG群和L站都有大量的二次元头像,这个事情里有商机!如果我们向二次元头像征税,岂不是要赚的盆满钵满?
这本质上是个分类模型,我之前玩过 ResNet 的训练和推理,应该很容易实现。说干就干,我立刻掏出之前为识别 Arkose 验证码时训练的模型代码,开始爆改。随即下载了L站的所有头像,还到 GitHub 扫了一圈,开始为数据打标,分训练集、测试集、验证集。准备好这一切后,又去线上租了台 GPU 服务器进行训练。经过多轮训练、调试和优化,终于把 loss 压到了 0.1% 以下。
这个模型很棒,拿它在验证集上试了试,达到 100% 的识别率。我非常激动地把它接到...