CD (@cdxiadong)我们的claudecode数据 对于ai大模型开发工程师来说重要吗 中发帖

传统的 Dataset 往往缺乏真实的工程上下文(如复杂的依赖关系、多文件关联)。ClaudeCode 基于真实仓库产生的交互轨迹,是否比目前的合成数据更能解决模型在处理大规模工程时的“幻觉”问题? 我们的数据是否会被拿去训练  有从事这方面的大佬有什么见解吗?  我期望写一篇文章来研究一下 主题就是“我们的claudecode数据 对于ai大模型开发工程师来说重要吗”