Kafei量化大厂九坤投资和微软成功复现DeepSeek-R1 中发帖

Github链接在此。 
[Unakar/Logic-RL: Reproduce R1 Zero on Logic Puzzle]

科技圈和金融圈又联动一波——量化大厂九坤投资联手微软亚洲研究院,首次成功复现了国产大模型DeepSeek-R1的强化学习成果。团队用逻辑谜题作为训练数据,设计了一套“强迫AI动脑”的规则:比如必须分步骤思考、严禁输出“蒙答案”的格式奖励函数,最终让模型在数学竞赛题(AIME/AMC)上展现出超预期的泛化能力。
九坤和幻方,A股两大量化厂在AI领域突破不断,感觉总带着点黑色幽默。韭菜除了贡献交易量,可能还得兼职当数据和财富燃料……🤦‍♂️
不过如果AI真能带飞中国企业的生产力,或许韭菜们能一边被“量化镰刀”割,一边也见证A股走出“既涨估值又涨业绩”的魔幻双赢……😄