TerryFlatley 在 yi-lightning的审查貌似有点高中发帖之前测 GAOGAO 的数据集测历史题就已经有好几个题目别的模型都能做，它做不了

TerryFlatley 在 yi-lightning的审查貌似有点高中发帖

之前测 GAOGAO 的数据集测历史题就已经有好几个题目别的模型都能做，它做不了。 
这次找到了关于加密货币技术领域测试集，测了好几个题目都过不了审查。 
有兴趣的佬友可以看看 
 [GYdIX_4agAAvlcN] 
部分项目介绍 

任务数据集：230 个复杂任务，涵盖密码学、区块链、加密货币、DeFi/Dapps、共识机制、智能合约理解和审计、智能合约代码生成、场景模拟和基于加密网络的自治代理功能。
MVP 数据集：727 个用于快速 LLM 评估的多项选择题。(Note：由于其在评估 LLMs 的差异能力方面的局限性，该数据集仅用于初始概念演示，并且不包括在最终问题集中。
超过 400 个子领域和 1，300 个知识领域
涵盖密码学基础知识、智能合约、令牌经济学、DAO 和治理
专注于 AI 代理在区块链技术中的实际应用