下班打卡 - 早退 (@jjsc) 在 佬们,有没有大模型的测试工具推荐 中发帖
要做行业模型啦,打算在基础模型下轻度微调,还要评估prompt的调整效果。所以想找个gui的评估工具,可以可视化导入测试集合(最好是excel),然后可以做横向模型对比,也可以做同一测试集的不同prompt对比的。
佬们有没有什么工具推荐