Ningbainb要来力要来力!DeepSeek新模型MODEL1曝光 中发帖

昨晚DeepSeek在GitHub更新FlashMLA代码,横 跨114个文件中有28处提到MODEL1,与V32作为不同的 模型出现。已知V32是DeepSeek-V3.2,MODEL1很可能 是新的架构。 
[1768979742473]