存档账号 (@updownup)随堂小测 GPTZero vs 各大小LLM,测一测哪个AI模型生成的文字更难被发现 中发帖

经典拟人prompt: 
写一篇关于后端的一周工作总结 散文形式,600字
时间有限只进行了一轮测试,部分模型来自lmarena.ai,默认参数,后期可能会增加测试次数。
文心一言(API):
[图片]
ChatGPT-4o-1120:
[图片]
Gemini-2.0-flash-thinking-exp-1219:
[图片]
Gemini-2.0-flash-exp:
[图片]
Gemini-exp-1206:
[图片]
Deepseek-v3:
[图片]
llama-3.3-70b-instruct:
[图片]
QvQ-32b:
[图片]
ChatGPT-4o-0903:
[图片]
ChatGPT-4o-mini:
[图片]
ChatGPT-4o-0513:
[图片]
Claude-3.5-sonnet-1022:
...