jam1024 (@geekjam) 在关于模型评分评测中发帖好像每个人不同视角下得出的评价不同，相同的应用场景下每个人做的东西不同也可能得出不同的评价

jam1024 (@geekjam) 在关于模型评分评测中发帖

好像每个人不同视角下得出的评价不同，相同的应用场景下每个人做的东西不同也可能得出不同的评价。 
市面上的通用评分跑分方法好像也得不到大多认同。 
感觉好像得结合自身场景和需求，构建自己的模型评分试题和流程，进行有效的对出现的模型进行测试。