林黛玉倒拔垂杨柳 (@Qiner) 在 ✊ Bookmarklet 网页文本抓取方案 2.0 中发帖
(\ _ /)
( ・-・)
/っ ☕ 以前发过一个,不过抓整篇文档页的效果不太好,升级下。
[PixPin_2026-03-02_00-22-48]
[PixPin_2026-03-02_00-23-34]
简而言之就是 ↙ ( 点 一 下 书 签 )
[PixPin_2026-03-02_00-27-05]
抓出来就是 Markdown 格式的了 ↙ ( 后 续 再 投 喂 给 AI )
[PixPin_2026-03-02_00-28-22]
Jina、Firecrawl 那种抓 URL 的有两个缺点:① 是以 URL 为单位抓、里面有不少浪费 Tokens 的引导菜单 URL 啥的,洁癖.jpg;② 是这种远程抓取方式容易有鉴权问题。
(\ _ /)
( ・-・)
/っ 🧀 总而言之就是这样 ↓ JavaScript 源码 ↙
▶
随便新建个...