@d3f请问大佬们,现在AI这么火,有没有什么工具或者方法来测试哪个模型更好一点? 中发帖

看过opencompass之类的开源工具,感觉使用起来有点复杂。 
大家在工作中有没有遇到过这种需求,有没有合适的工具分享。比如测试embedding、重排、语义相似度等等的工具。