Haobo LYU (@may3rr) 在 个人向大模型排行榜 中发帖
总结一下我个人使用下来不同LLM的体验。欢迎大家一起讨论不同的模型的能力边界。
(接下来都仅讨论官方网页端使用体验,而非API的体验)
OpenAI:
GPT 4o:仍然是我的爱用模型,首字时延非常低,模型能力也很强。缺点是有的时候透露想让它直接给出完整代码文件,它总是偷懒只给对应函数的。(x)
o3:很强的推理模型,但是没怎么用过。而且Plus会员的条数也很少。缺点是总喜欢说:“一句话解决”
Anthropic:
Claude 3.7 Sonnet:最强的编码模型,上下文很长,使用的时候不会担心它忘掉前面的内容。缺点是Pro会员的条数很少,直接就是告诉你还剩一条消息,然后几个小时用不了
Claude 3.7 Sonnet thinking:强,但是喜欢在thinking的时候给代码写一遍,很浪费时间和输出tokens
Claude 3.5 Sonnet:依旧能打
G...