CrawlForge
首页应用场景集成价格文档博客
一个 MCP server 集成 18 个网页抓取工具:CrawlForge 完整指南
Product Updates
返回博客
产品更新

一个 MCP server 集成 18 个网页抓取工具:CrawlForge 完整指南

C
CrawlForge Team
工程团队
2026年1月7日
阅读时长 10 分钟
更新于 2026年4月14日

本页内容

快速解答

CrawlForge MCP 将 20 个专用网页抓取工具集成到单个 MCP server 中:基础获取器(1 credit)、结构化与智能提取器(2 credits)、爬虫与搜索(3-5 credits)以及 AI 驱动的 deep_research(10 credits)。一个 API key、一种统一的响应格式,Claude 可以自动为每个任务挑选合适的工具。

对 AI 应用而言,网页抓取从未像今天这般关键。无论你是在构建 RAG 系统、训练模型还是创建智能体,都需要可靠地获取网络数据。CrawlForge MCP 在单个软件包中提供 20 个专用工具,专为使用 Claude 及其他 LLM 进行构建的开发者设计。

为什么一个 MCP server 能改变一切

传统抓取方案迫使你拼凑多个工具:

  • 一个用于简单获取的基础 HTTP 客户端
  • 一个面向重度 JavaScript 站点的浏览器自动化框架
  • 一个独立的搜索服务
  • 另一个用于内容提取的工具
  • 再来一个用于监控变更的工具

有了 CrawlForge,你将获得一套统一的 API,拥有一致的认证、定价和响应格式。Claude 可以智能地为每个任务挑选合适的工具。

完整工具参考

基础工具(每个 1 credit)

这些基础工具能高效处理最常见的抓取任务:

fetch_url

最简单的工具 —— 从任意 URL 获取原始 HTML,并自动处理重定向。

Bash

**最适合:**初始页面加载、API 端点、静态内容

extract_text

剥离 HTML,返回干净、可读的文本内容。

Bash

**最适合:**内容分析、LLM 上下文、文本处理

extract_links

解析所有锚点标签,返回结构化的链接数据。

**最适合:**站点映射、爬虫种子、SEO 分析

extract_metadata

提取 SEO 元数据、Open Graph 标签、Twitter cards 和 Schema.org 数据。

**最适合:**内容预览、SEO 审计、社交分享分析

结构化提取工具(每个 2 credits)

当你需要的不只是原始内容时:

scrape_structured

使用 CSS 选择器将特定元素提取为结构化 JSON。

Typescript

**最适合:**电商数据、列表、结构化页面

extract_content

智能主体内容提取 —— 去除导航、广告和样板内容。

**最适合:**文章、博客文章、文档页面

map_site

发现并映射网站结构,找出所有可访问的 URL。

Typescript

**最适合:**抓取前规划、文档索引、站点地图生成

process_document

通过 URL 从 PDF 及其他文档格式中提取文本。

**最适合:**PDF 抓取、文档处理、学术论文

localization

地理定向抓取,提供 26+ 个国家/地区代理、时区伪装和区域设置请求头。

Typescript

**最适合:**价格对比、本地化内容、有地域限制的站点

高级工具(3-5 credits)

面向复杂的抓取场景:

analyze_content(3 credits)

AI 驱动的内容分析,包括情感、语言检测和主题提取。

**最适合:**情感分析、内容分类、语言检测

stealth_mode(5 credits)

反检测浏览,配备指纹随机化和人类行为模拟 —— 与 Playwright 在底层使用的技术相同,并应用了隐身补丁。

**最适合:**带机器人检测的站点、受 Cloudflare 保护的页面

summarize_content(4 credits)

由 AI 生成的摘要,长度和侧重点可配置。

**最适合:**内容摘要、调研综述、快速概览

crawl_deep(4 credits)

多页爬取,支持深度控制、模式匹配和内容提取。无论爬取多少页面,每次调用固定 4 credits。

Typescript

**最适合:**博客归档、文档站点、全站索引

scrape_with_actions(5 credits)

浏览器自动化,具备点击、输入、滚动和截图能力。

Typescript

**最适合:**需登录的内容、交互式表单、SPA 导航

batch_scrape(5 credits)

以统一的响应格式并行处理多个 URL。无论 URL 数量多少,每次调用固定 5 credits。

Typescript

**最适合:**批量数据采集、对比抓取、效率

search_web(5 credits)

集成 Google Custom Search 以发现相关 URL。

**最适合:**调研起点、主题发现、竞争分析

track_changes(3 credits)

以可配置的灵敏度监控网站内容变更。每次调用固定 3 credits。

**最适合:**竞争对手监控、价格跟踪、新闻提醒

AI 调研工具(10 credits)

deep_research

最强大的工具 —— 带来源验证与综合的多阶段调研。

Typescript

返回:

  • 综合后的摘要
  • 带置信度评分的关键发现
  • 带相关性排序的已验证来源
  • 来源之间的冲突检测

**最适合:**竞争情报、市场调研、技术调研、事实核查

credits 优化技巧

  1. 从便宜的开始:在尝试昂贵工具之前先用 fetch_url(1 credit)
  2. 能批处理就批处理:batch_scrape 比单独调用更高效
  3. 了解你的 URL:已有 URL 时不要用 search_web(5 credits)
  4. 缓存结果:相同 URL = 相同内容,不要不必要地重复抓取
  5. 用对工具:extract_content(2 credits)胜过手动解析

定价对比

PlanCredits/月价格每 credit 成本
Free1,000$0-
Hobby5,000$19$0.0038
Professional50,000$99$0.00198
Business250,000$399$0.00160

开始使用

  1. 在 crawlforge.dev/signup 免费注册
  2. 即刻获得 1,000 credits(无需信用卡)
  3. 5 分钟内接入 Claude Desktop(指南)

**准备好开始了吗?**在 crawlforge.dev 创建你的免费账户,今天就解锁全部 20 个工具。

标签

MCPWeb ScrapingAPIProduct GuideClaude

关于作者

C

CrawlForge Team

工程团队

我们正在打造功能最全面的 Web 抓取 MCP server。我们开发的工具帮助开发者为 AI 应用提取、分析和转换 Web 数据。

本页内容

Frequently Asked Questions

CrawlForge MCP 中的 20 个网页抓取工具是哪些?+

CrawlForge 集成了四个基础工具(fetch_url、extract_text、extract_links、extract_metadata,每个 1 credit)、结构化提取器如 scrape_structured 和 extract_content(2 credits)、高级工具如 crawl_deep、batch_scrape、search_web 和 stealth_mode(3-5 credits),以及 AI 驱动的 deep_research 工具(10 credits)—— 全部置于单个 API key 之后。

为什么要用一个 MCP server 而不是多个抓取工具?+

传统抓取迫使你组合 HTTP 客户端、浏览器自动化框架、搜索服务、内容提取器和变更监控器。CrawlForge 为你提供一套统一的 API,拥有一致的认证、定价和响应格式,让 Claude 能智能地为每个任务挑选合适的工具。

对于简单的页面获取,CrawlForge 哪个工具最便宜?+

用 fetch_url(1 credit)获取原始 HTML,或用 extract_text(1 credit)获取干净可读的文本。对于静态内容、API 端点和 LLM 上下文准备,这是最高效的选择 —— 把更昂贵的工具留给便宜工具无法胜任的场景。

我什么时候该用 deep_research 而不是 search_web?+

search_web 返回 Google 风格的结果,而 deep_research(10 credits)会执行带引用跟踪和冲突检测的多来源验证。当你需要从众多来源得出一个综合答案、而不仅仅是一份链接列表时,请使用 deep_research。

全部 20 个工具在免费层级都能用吗?+

可以。每个套餐,包括 1,000 credits 的免费层级,都能访问全部 20 个工具。你只需通过 credits 系统按使用量付费,因此可以在免费套餐上试用 stealth_mode、deep_research 和 batch_scrape,找到适合你工作流的工具。

相关文章

CrawlForge v4.2.2:全新 CLI + 3 个本地 AI scraping 工具
Product Updates

CrawlForge v4.2.2:全新 CLI + 3 个本地 AI scraping 工具

v4.2.2 带来了独立的 CLI、基于 Ollama 的本地 LLM 提取,以及面向 10 个热门站点的一行式 scraper。以下是本次变更内容。

C
CrawlForge Team
|
5月18日
|
6 分钟
CrawlForge MCP 现已上线:为 AI agent 提供免费 web scraping
Product Updates

CrawlForge MCP 现已上线:为 AI agent 提供免费 web scraping

CrawlForge MCP 今日上线,提供 20 个 web scraping 工具、面向 Claude 和 Cursor 的 MCP 集成,以及包含 1,000 credits 的免费套餐。更快地构建 agent。

C
CrawlForge Team
|
3月31日
|
6 分钟
CrawlForge 对比 Apify 对比 ScrapingBee:2026 网页抓取对比
Web Scraping

CrawlForge 对比 Apify 对比 ScrapingBee:2026 网页抓取对比

深入对比 2026 年顶级的网页抓取平台。比较 CrawlForge MCP、Apify 和 ScrapingBee 的功能、价格和使用场景。

C
CrawlForge Team
|
1月9日
|
11 分钟

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。