stardustdragona 在 谷歌发布了TurboQuant,一种运行大模型时降低6倍内存占用、提高8倍速度且不影响性能的压缩技术 中发帖
TurboQuant:以极致压缩重新定义人工智能效率 — TurboQuant: Redefining AI efficiency with extreme compression
[aad1764afc7f33b24b260fdc605f2d77]