Jaeger 在 Fetcher MCP: 一个简单好用的用于抓取网页内容的 MCP 工具 中发帖
分享一个用于抓取网页内容的 MCP 工具: Fetcher MCP
用法
npx -y fetcher-mcp
优势
JavaScript 支持:与传统的网页抓取工具不同,Fetcher MCP 使用 Playwright 执行 JavaScript ,使其能够处理动态网页内容和现代 Web 应用程序。
智能内容提取:内置的 Readability 算法自动从网页中提取主要内容,移除广告、导航和其他非必要元素。
灵活的输出格式:支持 HTML 和 Markdown 两种输出格式,使其易于与各种下游应用程序集成。
并行处理:fetch_urls 工具能够并发抓取多个 URL ,显著提高批量操作的效率。
资源优化:自动阻止不必要的资源(图像、样式表、字体、媒体),以减少带宽使用并提高性能。
强大的错误处理:全面的错误处理和日志记录确保即使在处理有问题的网页...