林黛玉倒拔垂杨柳 (@Qiner) Bookmarklet 网页文本抓取方案 2.0 中发帖

(\ _ /) 
( ・-・)
/っ   以前发过一个,不过抓整篇文档页的效果不太好,升级下。
[PixPin_2026-03-02_00-22-48]
[PixPin_2026-03-02_00-23-34]
简而言之就是 ( 点 一 下 书 签 )
[PixPin_2026-03-02_00-27-05]
抓出来就是 Markdown 格式的了 ( 后 续 再 投 喂 给 AI )
[PixPin_2026-03-02_00-28-22]

Jina、Firecrawl 那种抓 URL 的有两个缺点:① 是以 URL 为单位抓、里面有不少浪费 Tokens 的引导菜单 URL 啥的,洁癖.jpg;② 是这种远程抓取方式容易有鉴权问题。

(\ _ /)
( ・-・)
/っ 🧀 总而言之就是这样 ↓ JavaScript 源码

随便新建个...