@HCPTangHYDeepSeek联合北大、清华研究团队发布DualPath推理系统,打破大模型存储带宽瓶颈 中发帖

北京大学、清华大学与DeepSeek-AI的联合研究团队发布了一项针对大语言模型推理架构优化的最新研究成果。该团队成功研发了名为DualPath的全新推理系统,专门解决智能体工作负载下KV-Cache存储I/O带宽受限的技术难题。 
[image]
[image]

[image]
依然27B小模型