公司最近在推进文搜图相关业务,主要是通过自然语言搜索图片,目前调研的实现方案使用 VLLM + qwen3-vl-embedding8B + Milvus,大佬们还有更好的方案或者模型推荐吗?目前公司资源有限只能支持 8B 的模型