佛系玩家 (@Foxi)关于提高AI在超长上下文下正确输出JSON格式输出的稳定性方案 中发帖

这是我前面发的提问帖子 

现在已经基本解决了,几十万上下文的情况下 稳定性也满足我的需求。
在调用api的时候 ,启用response_format字段,让大模型json格式化输出
然后加上代码对输出的字符串进行json格式提取,如果格式错误,则进行修复,极大提升了成功率。
这里附上我的json格式提取代码供各位佬们参考一下。
[image]
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

"""
JSON提取和修复工具类

这是一个独立的通用JSON处理工具,专门用于从各种异常格式的文本中提取和修复JSON数据。
具备强大的容错能力,可以处理AI生成文本中常见的JSON格式错误。

功能特性:
1. 对象间多余字符处理
2. 数值前多余字符处理
3. 字符串前多余字符处理
4. 双引号错位处理
5. 属...