@Cook_Sleep 在 原来ChatGPT官网上传文档会直接先解析出全文…… 中发帖
上传了 o1 系统卡PDF,在 Open WebUI 这种默认基于 embedding 模型抽取信息的项目里,死活无法进行这种宽泛的总结性回答,我看 embedding 抽出来的片段也不是很多很多,还以为是我参数设置有问题,结果今天用始皇的网站的调试工具查看模型实际接受到的信息……
[84dbe1b14dd6f9cc1e970de59a6c9303]
原来上传文件会直接解析文本全文…… 太长剩下的就被截断了,之后通过 embedding 模型找出需要的信息。
[01c8ed177d332acde3a68e1e5f1daa97]
如果用户问题的答案不在上述片段中,请记住搜索用户的文档。
我还以为 OpenAI 用的什么高级手段能弄那么全,原来也是注入全文……