@Cook_Sleep 在原来ChatGPT官网上传文档会直接先解析出全文…… 中发帖上传了 o1 系统卡PDF，在 Open WebUI 这种默认基于 embedding 模型抽取信息的项目里，死活无法进行这种宽泛的总结性回答，我看 embedding 抽出来的片段也不是很多很多，还以为是我参数设置有问题，结果今天用始皇的网站的调试工具查看模型实际接受到的信息…… [84dbe1b14dd6f9cc1e970de59a6c9303] 原来上传文件会直接解析文本全文…… 太长剩下的就被截断了，之后通过 embedding 模型找出需要的信息

@Cook_Sleep 在原来ChatGPT官网上传文档会直接先解析出全文…… 中发帖

上传了 o1 系统卡PDF，在 Open WebUI 这种默认基于 embedding 模型抽取信息的项目里，死活无法进行这种宽泛的总结性回答，我看 embedding 抽出来的片段也不是很多很多，还以为是我参数设置有问题，结果今天用始皇的网站的调试工具查看模型实际接受到的信息…… 
 [84dbe1b14dd6f9cc1e970de59a6c9303] 
原来上传文件会直接解析文本全文…… 太长剩下的就被截断了，之后通过 embedding 模型找出需要的信息。 
 [01c8ed177d332acde3a68e1e5f1daa97] 

如果用户问题的答案不在上述片段中，请记住搜索用户的文档。 

我还以为 OpenAI 用的什么高级手段能弄那么全，原来也是注入全文……