青菜法师 (@zzzccc158)国内外代码AI模型使用什么训练的? 中发帖

我有点疑惑,大模型都是要训练集的吧,那国外的代码类型的AI模型,是不是直接使用github训练的?或者github是否私下给予了这些AI公司大量的信息数据呢?国内外AI模型的差别是否就是差在这部分数据上? 
并非引战,只是对于这部分有点不是很懂