CrawlForge
首页应用场景集成价格文档博客
如何将 CrawlForge 与 Mastra AI agent 配合使用
Tutorials
返回博客
教程

如何将 CrawlForge 与 Mastra AI agent 配合使用

C
CrawlForge Team
工程团队
2026年4月21日
阅读时长 7 分钟

本页内容

Mastra 是一个 TypeScript 优先的 AI agent 框架,专为构建可投入生产的 AI 应用而设计。CrawlForge 则赋予这些 agent 抓取、提取和分析实时网页数据的能力。两者结合,你便能构建出可以研究主题、监控竞品、并从任意网站提取结构化数据的 agent。

本指南将通过可运行的 TypeScript 示例,向你展示如何把 CrawlForge 工具接入 Mastra agent。

目录

  • 什么是 Mastra?
  • 前置条件
  • 步骤 1:设置 Mastra 项目
  • 步骤 2:创建 CrawlForge 工具定义
  • 步骤 3:构建一个 web 研究 agent
  • 步骤 4:构建数据提取工作流
  • 步骤 5:添加错误处理与重试
  • credits 成本参考
  • 架构概览
  • 后续步骤

什么是 Mastra?

Mastra 是面向 AI 应用与 agent 的现代 TypeScript 框架。它提供了用于 agent 创建、工具集成、工作流和记忆的基础组件 —— 全部具备完整的类型安全。可以把它看作 AI agent 领域的 Express.js:精简、可组合、面向生产。

Mastra agent 可以通过标准化的工具接口使用外部工具。CrawlForge 工具能直接映射到该接口,让你的 agent 无需编写 HTTP 客户端代码即可拥有 20 项 web scraping 能力。

前置条件

  • Node.js 18+ 与 TypeScript 5+
  • 一个带 API key 的 CrawlForge 账户(1,000 个免费 credits)
  • 对 TypeScript 和 async/await 的基本了解

步骤 1:设置 Mastra 项目

创建一个新的 Mastra 项目并安装依赖:

Bash

将你的 CrawlForge API key 添加到 .env:

Bash

步骤 2:创建 CrawlForge 工具定义

创建一个工具文件,将 CrawlForge 的 API 封装为与 Mastra 兼容的工具:

Typescript

步骤 3:构建一个 web 研究 agent

创建一个能够搜索网页并提取内容以完成研究任务的 agent:

Typescript

运行该 agent:

Typescript

步骤 4:构建数据提取工作流

Mastra 工作流让你能够把多个工具串联成确定性的流水线。下面是一个竞品价格监控器:

Typescript

步骤 5:添加错误处理与重试

生产环境的 agent 需要稳健的错误处理。下面是一个用于 CrawlForge 工具调用的模式:

Typescript

credits 成本参考

Credits工具Mastra 使用场景
1fetch_url、extract_text、extract_links、extract_metadataagent 工具中的快速数据抓取
2scrape_structured、extract_content、map_site、process_document、localization工作流提取、站点审计、文档处理
3track_changes、analyze_content变更检测、内容分析
4summarize_content、crawl_deep摘要生成、多页面爬取
5search_web、batch_scrape、scrape_with_actions、stealth_mode研究 agent、批量操作
10deep_research综合分析 agent

架构概览

组件职责
Mastra Agent编排工具调用,维护对话上下文
Mastra Tools围绕 CrawlForge API 端点的带类型封装
Mastra Workflow用于批量操作的确定性多步骤流水线
CrawlForge API执行 web scraping,返回结构化数据
Credit System按 API key 跟踪用量,强制执行限额

Mastra agent 会根据任务决定调用哪个 CrawlForge 工具。工具封装负责处理 HTTP 通信,CrawlForge 则执行实际的抓取。每次工具调用成功后,credits 都会被原子性地扣除。

后续步骤

  • Mastra 快速上手指南 —— Mastra 官方文档
  • CrawlForge API 参考 —— 完整的端点文档
  • 构建一个研究助手 —— 直接使用 Claude 的类似模式
  • 深度研究自动化 —— 进阶研究工作流

今天就构建你的第一个具备网络感知能力的 AI agent。 注册 CrawlForge(1,000 个免费 credits),脚手架生成一个 Mastra 项目,让你的 agent 拥有抓取整个网络的能力。

标签

mastraai-agentsmcpintegrationtutorialtypescriptweb-scraping

关于作者

C

CrawlForge Team

工程团队

我们正在打造功能最全面的 Web 抓取 MCP server。我们开发的工具帮助开发者为 AI 应用提取、分析和转换 Web 数据。

本页内容

相关文章

如何在 LangGraph 智能体中使用 CrawlForge
Tutorials

如何在 LangGraph 智能体中使用 CrawlForge

使用 LangGraph 和 CrawlForge 构建有状态的网页爬取智能体。本篇 TypeScript 指南涵盖图节点、状态管理以及条件化的爬取流程。

C
CrawlForge Team
|
4月24日
|
8 分钟
如何将 CrawlForge 与 Dify 工作流结合使用
Tutorials

如何将 CrawlForge 与 Dify 工作流结合使用

在 Dify 中将 CrawlForge 添加为自定义工具,让你的 LLM 应用工作流具备 web scraping 能力。附带工作流示例的无代码与 API 集成指南。

C
CrawlForge Team
|
4月22日
|
7 分钟
如何在 Cursor 规则中使用 CrawlForge
Tutorials

如何在 Cursor 规则中使用 CrawlForge

创建 .cursorrules 文件,教会 Cursor AI 高效使用 CrawlForge 工具。内含可直接使用的网页研究与数据提取规则。

C
CrawlForge Team
|
4月20日
|
7 分钟

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。