CowBoy (@haso2007) 在 佬们,deepseek moment 2要来了 中发帖
中国人工智能初创公司DeepSeek在2026年初发布了一篇技术论文,介绍了一种旨在使大型模型训练更稳定、更具成本效益的新型深度学习架构,业内观察人士认为这可能预示着该公司即将推出下一个重磅产品。这家总部位于杭州的公司于周四发布了关于流形约束超连接(mHC)的论文,由创始人梁文锋与首席研究员谢振达、魏奕萱和曹欢琦共同撰写。该架构解决了神经网络规模扩大时出现的关键训练不稳定性和可扩展性问题,研究团队表示,与现有方法相比,该架构提供了"切实的性能改进和卓越的可扩展性"。