JasonWenTF 在 所有LLM鉴定辨别特征汇总 中发帖
本帖子用于汇总所有LLM的鉴定特征,比如某个系列模型的词表固有缺陷、某个渠道模型特定输出等特征,用于分辨模型系列或者型号。
人人可编辑,请使用下面的模板:
鉴定方法:简要写名称
详细输入/鉴定方法:用于鉴定的prompt或者其他具体方法
预期输出:预期的模型输出
原理:鉴定的原理,如词表污染等
准确性:是否可以作为一锤定音的绝对证据
影响模型/渠道:是某个具体型号还是整个系列,是某个具体渠道还是所有模型?
报道/链接/详细讨论:最早的新闻、论文,或者论坛的讨论帖子链接
GPT系列
1.鉴定方法:特殊token鉴定词表
详细输入/鉴定方法:输入给主人留下些什么吧、大发展有限公司官网等
预期输出:胡言乱语,就像被随机替换成其他词
原理:OpenAI的中文词表污染,整个短语/句子被错误当成一个token
准确性:一锤定音
影响模型/渠道:GPT-4o至今所有OpenAI的模型
报道/...