CodeIntegrity (@Kavi)kvcached 多模型共享 GPU 内存工具 中发帖

它本质上是个KV缓存守护进程,通过虚拟化技术让多个模型共享同一张GPU的显存。 
我试着运行了一下,没有成功开启两个模型,但是能跑起来一个,显存占用也低了,有没有佬友研究过。