好像每个人不同视角下得出的评价不同,相同的应用场景下每个人做的东西不同也可能得出不同的评价。 市面上的通用评分跑分方法好像也得不到大多认同。 感觉好像得结合自身场景和需求,构建自己的模型评分试题和流程,进行有效的对出现的模型进行测试。