@youyushi文档切块处理策略求教 中发帖

背景: 
受限于当前大模型的能力,输入过多LLM容易注意力分散;在处理长文本的翻译或风格转换时,采用切块策略。
具体流程如下:

解析 docx 或 md 的层级,构建树形结构。
将结构中的内容提炼为摘要,并融合进树中,作为模型的上下文信息。
按该结构切块:每次仅输入当前块的完整内容,其他部分以树形结构与摘要作为补充上下文。
为每一块配备合适的提示词提交给大模型,最后按章节树形结构将结果拼接回去。

需要保持摘要的风格与术语一致,避免块间语气漂移。
请问这种思路是否正确,还有哪些地方需要完善,是否好实现?