李寻欢 (@lixunhuan) 在 震惊,开源大模型提取短信验证码性价比竟是它最高! 中发帖
哈哈哈,看到标题的不要打我!
前情提要
家里备用机一直在用SmsForwarder做短信转发到我主力机,最近发现有个大佬开发了一个sms_server,可以可视化展示一些数据,比我原来的转发到微信上更好看一些,于是就部署了一个,顺便看了看它的源码。惊讶的发现提取验证码使用的是正则提取(代码如下),精度堪忧。于是就想给它加上使用大模型去提取。于是就有了此文。
def extract_code_with_context(sms_content: str) -> Optional[str]:
"""
从短信内容中提取验证码
"""
pattern = r'(?:验证码|auth|code)[^0-9]{0,20}(\d{4,8})'
match = re.search(pattern, sms_content, re.IGNORECASE)
if...