盖世英雄卢本伟 (@dnslin) 在 如何提取一个网站的摘要信息 中发帖
因为有数量不小的网站 我需要对这些网站进行提取摘要
简而言之就是 知道这个网站大概是干嘛的 叫什么名字 有什么用
我尝试了使用 html头部的元数据 和 title 但是 并不是所有网站都有详细的SEO数据 ,然后我使用了 python的一些NLP 摘要算法包 去提取数据,效果也不是和理想, 倒是使用 chatgpt 4o 直接询问的话 它返回的摘要数据 倒是很好 完全符合我的要求,问题是 web面板的gpt 需要逆向才能拿到接口 并且这个是和朋友合租的。gpt 的api并不提供访问链接的功能 坛友有什么方法 可以推荐下