Sylar Shawn 在 国产大模型在空间理解能力上的对比分析 中发帖
问题描述
由于正在做一些调用大模型进行物理轨迹生成的科研工作,相关的一个比较直接的问题就是,哪个大模型的空间理解能力较强?
注:这里的空间理解能力主要是指,在给出初始点、目标点、障碍物等信息之后,大模型能够依靠自身的信息处理能力,得出一条连续的、且能够从初始到目标点的轨迹。
LLM选型
由于实际使用时,需要兼顾LLM的响应速度和回复质量,因此既不能选参数量太大的模型,也不能选参数量过小的模型。经过对相关模型的对比调研,也参考了L站内的部分帖子:
1-佬友们,国内大模型怎么选?
2-国内哪些大模型有望赶上gpt,claude和gemini
3-国内外有哪些国内大模型LLM能做到MiniMAX一样的功能,能够自动完成任务,并且同时生成文档的
模型来源于“硅基流动”中转站的API,无广。
最后选择了以下5个国内大模型:
deepseek-ai/DeepSeek-V3,选择V3是因...