Smaller_Tiny 在 关于自己学习使用Cherry studio知识库的一些问题(学习过程) 中发帖
最近写一些单位文档在尝试使用Cherry studio的知识库,先是论坛学习了一番,正好也有填写硅基流动的key,他自带了一个嵌入模型BAAI/bge-m3,在知识库可以使用,一切挺好,
但是遇到了问题就是一个大概上百页的docx文件,读取不了,显示是录入了知识库,但是关键词内容都是搜索不出来。
继续扒拉论坛看有佬换了模型就好了,处于便于获得原则试了试阿里云百炼的“text-embedding-v3”模型(请和我一样的小白注意这哥们在模型广场搜不到只有中文名叫通用文本向量),结果是一样的。
最后尝试其他方案、另存为新的docx都不行,最后方案是另存为pdf解决了问题。
也是请教下各位佬,是不是PDF是不是向量转化支持性更好,或者有其他解决方案