白日梦蓝 (@SummerLove) 在 AutoLabelimage pro max —— 一个简单的yolo自动标注小工具 中发帖
之前开发时遇到了需要标注yolo格式数据的情况,当时用ai简单搜了一下,虽然有一些借助自动标注的解决方案,但是基本都是半监督式的标注方法,对于一些比较小众的检测类别,初始的数据标注还是需要人工来做,最终找了半天也没找到可以解决我需求的应用,于是只能去人工慢慢标注了。
最近几天正好在本地部署一些小模型,干脆拿来试试效果,结果发现对于没有专门预训练的模型来说,虽然可以正确理解图片的意思,但是很难返回一个比较精准的坐标。再后来才发现有一些预训练后支持直接输出相对坐标位置的模型,最终经过测试发现Qwen3VL-8B-Instruct-Q4_K_M在我的5070上跑起来效果最好,就是准确度略差,位置总会差一些。再后来我继续问ai,发现很多半监督的自动标注方法会借助sam来精修,从而让box更精准,那这个方法应该同样可以解决我的问题,于是在前两天趁着gpt team还没死的时候用codex把程序写出...