@YDong求识别图片的小模型推荐 中发帖

基于之前一个帖子有个想法:对图片/视频进行模型识别,得出对图片的描述,将这段文字存储为向量。再对图片/视频搜索时,会给出相似的图片/视频(有点类似于苹果/华为的图库搜索) 
我有大量的图片/视频懒得整理,这样可能会好一些
现在遇到一个问题,使用什么模型进行识别?熟知的模型肯定不行,太大了,本地运行不了,线上不安全;小模型太多了,挑不过了。昨天花费几个小时仅找到三个小模型,还仅安装成功一个 :tieba_087:
求推荐一个合适的模型
这样是不是无法对某一个人物进行搜索,只能搜索大致的场景(再添加一个人物识别模型? :bili_007:

或者有没有类似的开源项目/软件(我知道utools的everything,但是没有测试效果(mac用不了)

安装成功的是moondream-2b-int8,效果是可以接受的,但是太慢了,识别一张图要 26.417147874832153 sec...