CrawlForge
首页应用场景集成价格文档博客
如何将 CrawlForge 与 OpenAI Agents SDK 结合使用
Tutorials
返回博客
教程

如何将 CrawlForge 与 OpenAI Agents SDK 结合使用

C
CrawlForge Team
工程团队
2026年4月13日
阅读时长 8 分钟
更新于 2026年4月14日

本页内容

OpenAI 的 Agents SDK 提供了一个可用于生产环境的框架,用于构建具备工具调用、任务移交(handoff)和护栏(guardrail)的自主 AI agent。CrawlForge 补上了缺失的一环:实时的网络访问能力。通过将 CrawlForge 的 20 个 scraping 工具连接到你的 OpenAI agent,你可以让它们搜索网络、提取结构化数据、阅读文档并开展多源研究——这一切都在 Agents SDK 的编排框架内完成。

本指南将向你展示如何把 CrawlForge 工具定义为 OpenAI agent 函数,并构建基于实时网页数据采取行动的 agent。

目录

  • 前置条件
  • 架构:CrawlForge + OpenAI agent
  • 步骤 1:创建 CrawlForge 工具函数
  • 步骤 2:构建一个网络研究 agent
  • 步骤 3:添加结构化数据提取
  • 进阶:多 agent 网络流水线
  • credits 成本明细
  • 最佳实践
  • 后续步骤

前置条件

Bash
Bash

在 crawlforge.dev/signup 获取你的 CrawlForge API key——包含 1,000 个免费 credits。

架构:CrawlForge + OpenAI agent

OpenAI Agents SDK 使用一种与函数调用 API类似但编排能力更丰富的工具模式。你将工具定义为带有 JSON Schema 参数的函数,由 agent 决定何时以及如何调用它们。

User Query -> OpenAI Agent -> Tool Selection -> CrawlForge API -> Results -> Agent Response

CrawlForge 位于 https://crawlforge.dev/api/v1/tools/ 的 REST API 可以干净地映射到 Agents SDK 的工具定义格式。每个工具都成为 agent 可以调用的一个函数。

步骤 1:创建 CrawlForge 工具函数

首先,创建一个可复用的 CrawlForge 客户端和工具定义:

Typescript

步骤 2:构建一个网络研究 agent

创建一个使用 CrawlForge 工具来研究主题的 agent:

Typescript

该 agent 会自主完成:

  1. 调用 search_web 查找相关文章(5 credits)
  2. 对排名靠前的结果调用 extract_content(每次 2 credits)
  3. 综合生成带引用的摘要

步骤 3:添加结构化数据提取

构建一个从网页中提取特定字段的数据提取 agent:

Typescript

进阶:多 agent 网络流水线

Agents SDK 支持在专用 agent 之间进行移交(handoff)。构建一个流水线,让研究员 agent 查找来源,然后移交给分析师 agent:

Typescript

这个流水线实现了关注点分离:collector 负责采集数据(消耗 CrawlForge credits),analyst 负责处理数据(无需 credits)。总成本取决于获取的来源数量——一次 3 个来源的比较通常需要 15-25 credits。

credits 成本明细

Agent 工作流使用的工具预估 credits
单次搜索 + 摘要search_web + extract_content7
3 个来源的研究search_web + 3x extract_content11
结构化提取(1 个页面)scrape_structured2
多 agent 比较(3 个来源)search_web + 3x extract_content + scrape_structured15
深度研究报告deep_research10

CrawlForge 的 Free 套餐(1,000 credits)每月大约可支持 90 次“搜索并提取”工作流。Professional 套餐($99/月,50,000 credits)可应对生产环境的 agent 负载。

最佳实践

优先选择成本最低的工具。 agent 的指令应引导它在可接受完整 HTML 时使用 fetch_url(1 credit),仅在需要干净文本时才使用 extract_content(2 credits)。把 deep_research(10 credits)留给复杂的多源查询。

限制 agent 步骤数。 设置工具调用的最大次数来控制成本。大多数研究任务在 3-5 次工具调用内即可完成。

用移交处理复杂流水线。 与其用一个挂满工具的 agent,不如拆分职责。collector agent 处理网络访问(消耗 credits),analyst agent 处理数据(无需 credits)。

缓存工具输出。 如果你的 agent 反复访问同一个 URL,请实现响应缓存,以避免重复的 credits 扣费。

监控用量。 在 CrawlForge 控制台中查看你的 credits 消耗,并为异常激增设置告警。

后续步骤

现在你已经拥有可以访问实时网页数据的 OpenAI agent。继续构建:

  • 20 个 CrawlForge 工具概览——为你的 agent 注册更多工具
  • Stealth mode 抓取——访问带有反爬虫保护的网站
  • 深度研究自动化——使用 10 credits 的 deep_research 工具生成全面报告
  • CrawlForge 快速上手——完整的 MCP 配置指南

让你的 OpenAI agent 拥有洞察网络的眼睛。 免费开始,获得 1,000 credits,无需信用卡。

标签

openaiagents-sdkintegrationweb-scrapingai-agentstutorialfunction-calling

关于作者

C

CrawlForge Team

工程团队

我们正在打造功能最全面的 Web 抓取 MCP server。我们开发的工具帮助开发者为 AI 应用提取、分析和转换 Web 数据。

本页内容

相关文章

如何在 LangGraph 智能体中使用 CrawlForge
Tutorials

如何在 LangGraph 智能体中使用 CrawlForge

使用 LangGraph 和 CrawlForge 构建有状态的网页爬取智能体。本篇 TypeScript 指南涵盖图节点、状态管理以及条件化的爬取流程。

C
CrawlForge Team
|
4月24日
|
8 分钟
如何将 CrawlForge 与 Mastra AI agent 配合使用
Tutorials

如何将 CrawlForge 与 Mastra AI agent 配合使用

使用 Mastra 与 CrawlForge 构建具备 web scraping 能力的 AI agent。包含工具集成、工作流和 agent 示例的 TypeScript 配置指南。

C
CrawlForge Team
|
4月21日
|
7 分钟
如何在 Make 和 Zapier 中使用 CrawlForge
Tutorials

如何在 Make 和 Zapier 中使用 CrawlForge

把 CrawlForge 接入 Make(Integromat)和 Zapier,实现自动化网页抓取。借助 HTTP 模块、webhook 和工作流示例完成无代码配置。

C
CrawlForge Team
|
4月23日
|
8 分钟

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。