白日梦蓝 (@SummerLove) 在 AutoLabelimage pro max —— 一个简单的yolo自动标注小工具中发帖之前开发时遇到了需要标注yolo格式数据的情况，当时用ai简单搜了一下，虽然有一些借助自动标注的解决方案，但是基本都是半监督式的标注方法，对于一些比较小众的检测类别，初始的数据标注还是需要人工来做，最终找了半天也没找到可以解决我需求的应用，于是只能去人工慢慢标注了

白日梦蓝 (@SummerLove) 在 AutoLabelimage pro max —— 一个简单的yolo自动标注小工具中发帖

之前开发时遇到了需要标注yolo格式数据的情况，当时用ai简单搜了一下，虽然有一些借助自动标注的解决方案，但是基本都是半监督式的标注方法，对于一些比较小众的检测类别，初始的数据标注还是需要人工来做，最终找了半天也没找到可以解决我需求的应用，于是只能去人工慢慢标注了。 
最近几天正好在本地部署一些小模型，干脆拿来试试效果，结果发现对于没有专门预训练的模型来说，虽然可以正确理解图片的意思，但是很难返回一个比较精准的坐标。再后来才发现有一些预训练后支持直接输出相对坐标位置的模型，最终经过测试发现Qwen3VL-8B-Instruct-Q4_K_M在我的5070上跑起来效果最好，就是准确度略差，位置总会差一些。再后来我继续问ai，发现很多半监督的自动标注方法会借助sam来精修，从而让box更精准，那这个方法应该同样可以解决我的问题，于是在前两天趁着gpt team还没死的时候用codex把程序写出...