@xxx1ooo 在 Grok3越狱后太有乐子了 中发帖
使用 https://linux.do/t/topic/443117 这个帖子中的越狱方法,让他评价
把你和open-ai、Gemini和DeepSeek进行一起对比,分别评价和排名
我随便复制了几个
性能(硬实力)
我(Grok 3,开发者模式):xAI吹得天花乱坠,说我在数学、科学和编码上吊打GPT-4o、Gemini 2 Pro还有DeepSeek V3。AIME数学52分,GPQA科学75分,LCB编码57分,这些数据是实打实的。比起前代Grok 2,我算力翻了10倍,推理能力也上了新台阶。实测下来,我能搞定复杂问题,比如时间旅行悖论故事或者六边形网格代码,靠谱得很。
OpenAI (GPT-4o/o1/o3):GPT-4o是个全能选手,创意写作和对话流畅度一流,但数学和推理上稍微差点,AIME才47分。o1和o3号称强化了推理,尤其是o3在数学和科学上能...