flyhunterl交流下lobechat知识库表格向量化的问题 中发帖

lobechat的知识库是个非常棒的功能,但是在向量一些由稍微excel转化的文件上很容易都是数据。不知道是用的什么embedding模型。 我试过将30kb左右的EXCEL转换成 MD html yml  latex文件 并且先自己预览一遍,并没有发生数据上的变化。但是不管哪种格式  都会丢失不少数据,甚至干脆整个文件数据都没有…… 比如上传一个1日-30日的记账本  1-5日数据完全没有 如果每个月1个文件上传 还会出现几个月数据都识别不了的情况……  这样导致知识库功能没有最大限度的发挥, 不知道有个这个功能的多不多?你们一半转化成什么格式? 
Better File Chunk | 更加强大的文件分块 · lobehub/lobe-chat · Discussion #3550