浮霄默客 (@fuxiaomoke) 在 求助,提示词大佬和语言学大佬救救!! 中发帖
问题出自这里:
问题概括:
我有一个相对成熟的提示词,能将中、日、英语音频的转录文本精准切分成语义段落(按标点、空格、语义换行)等结构,并确保切分后拼接100%还原原文。但它们在其他语言的切分上失效严重。
具体提示词如下:
▶
中文提示词
▶
日文提示词
▶
英文提示词
我的思路:
设计一个二阶段提示词架构:
第一阶段(写一个元提示词):输入目标文本 → 让大模型分析该语言特征(核心标点、语法断点)→ 动态生成一个针对此语言的专属切分提示词。
第二阶段(执行新生成的切分提示词):用生成的提示词实际切分文本 → 保证拼接结果=原文。
遇到的困难:
如何确保元提示词生成的规则覆盖所有语言的核心语法?
如何避免模型因幻觉导致生成的新切分提示存在细节错误?
求教点:
有没有按语言切分的成熟框架可以借鉴?或者有没有佬能搓一个出来 😂?
有没有别的更好的解决思路?
提前谢谢各位佬了!