佛系玩家 (@Foxi) 在 关于提高AI在超长上下文下正确输出JSON格式输出的稳定性方案 中发帖
这是我前面发的提问帖子
现在已经基本解决了,几十万上下文的情况下 稳定性也满足我的需求。
在调用api的时候 ,启用response_format字段,让大模型json格式化输出
然后加上代码对输出的字符串进行json格式提取,如果格式错误,则进行修复,极大提升了成功率。
这里附上我的json格式提取代码供各位佬们参考一下。
[image]
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
JSON提取和修复工具类
这是一个独立的通用JSON处理工具,专门用于从各种异常格式的文本中提取和修复JSON数据。
具备强大的容错能力,可以处理AI生成文本中常见的JSON格式错误。
功能特性:
1. ✅ 对象间多余字符处理
2. ✅ 数值前多余字符处理
3. ✅ 字符串前多余字符处理
4. ✅ 双引号错位处理
5. ✅ 属...