Haobo LYU (@may3rr) 在个人向大模型排行榜中发帖总结一下我个人使用下来不同LLM的体验

Haobo LYU (@may3rr) 在个人向大模型排行榜中发帖

总结一下我个人使用下来不同LLM的体验。欢迎大家一起讨论不同的模型的能力边界。 

（接下来都仅讨论官方网页端使用体验，而非API的体验） 

OpenAI： 

GPT 4o：仍然是我的爱用模型，首字时延非常低，模型能力也很强。缺点是有的时候透露想让它直接给出完整代码文件，它总是偷懒只给对应函数的。（x）
o3：很强的推理模型，但是没怎么用过。而且Plus会员的条数也很少。缺点是总喜欢说：“一句话解决”


Anthropic： 

Claude 3.7 Sonnet：最强的编码模型，上下文很长，使用的时候不会担心它忘掉前面的内容。缺点是Pro会员的条数很少，直接就是告诉你还剩一条消息，然后几个小时用不了
Claude 3.7 Sonnet thinking：强，但是喜欢在thinking的时候给代码写一遍，很浪费时间和输出tokens
Claude 3.5 Sonnet：依旧能打


G...