TerryFlatleyyi-lightning的审查貌似有点高 中发帖

之前测 GAOGAO 的数据集测历史题就已经有好几个题目别的模型都能做,它做不了。 
这次找到了关于加密货币技术领域测试集,测了好几个题目都过不了审查。
有兴趣的佬友可以看看
[GYdIX_4agAAvlcN]
部分项目介绍

任务数据集:230 个复杂任务,涵盖密码学、区块链、加密货币、DeFi/Dapps、共识机制、智能合约理解和审计、智能合约代码生成、场景模拟和基于加密网络的自治代理功能。
MVP 数据集:727 个用于快速 LLM 评估的多项选择题。(Note:由于其在评估 LLMs 的差异能力方面的局限性,该数据集仅用于初始概念演示,并且不包括在最终问题集中。
超过 400 个子领域和 1,300 个知识领域
涵盖密码学基础知识、智能合约、令牌经济学、DAO 和治理
专注于 AI 代理在区块链技术中的实际应用