codeboy 在 【开源】图像打标神器!结合 WD-Tagger 和 VLM,为你的炼丹炉输送高质量燃料! 中发帖
各位佬友,大家好!
之前我分享过一个用 VLM 打标签的小工具,收到了不少好评。为了让标签质量更上一层楼,我把它重构升级成了一个 混合模式图像标注器 (Hybrid Image Tagger)!
解决了什么痛点?
目前的主流生图模型 (如 Flux) 对自然语言的理解能力越来越强,而传统的 wd-tagger 虽然能精准识别固定词汇(如角色名、作品名),但不支持自然语言,无法描述复杂的场景和风格。只用 VLM 又可能丢失一些关键的专有词汇,并且可能引入幻觉和生僻词。
这个新工具,就是为了解决这个问题而生! 它巧妙地结合了 传统 WD Tagger 和 视觉大语言模型 (VLM) 的双重优势,生成既精准又富有描述性的高质量标签,让你的 LoRA 训练事半功倍。
✨ 主要功能亮点
🚀 混合模式打标:同时调用 WD Tagger 和 VLM,通过 LLM 将精准的词汇标签和生动的自然语...