En esta página
El Agents SDK de OpenAI ofrece un framework listo para producción para crear agentes de IA autónomos con uso de herramientas, traspasos (handoffs) y guardrails. CrawlForge aporta la pieza que falta: acceso web en vivo. Al conectar las 20 herramientas de scraping de CrawlForge a tus agentes de OpenAI, les permites buscar en la web, extraer datos estructurados, leer documentación y realizar investigación de múltiples fuentes, todo dentro del framework de orquestación del Agents SDK.
Esta guía te muestra cómo definir las herramientas de CrawlForge como funciones de agente de OpenAI y crear agentes que actúan sobre datos web en tiempo real.
Tabla de contenidos
- Requisitos previos
- Arquitectura: CrawlForge + agentes de OpenAI
- Paso 1: Crea las funciones de herramienta de CrawlForge
- Paso 2: Crea un agente de investigación web
- Paso 3: Añade extracción de datos estructurados
- Avanzado: pipeline web multiagente
- Desglose del coste en credits
- Buenas prácticas
- Siguientes pasos
Requisitos previos
Consigue tu API key de CrawlForge en crawlforge.dev/signup: incluye 1.000 credits gratis.
Arquitectura: CrawlForge + agentes de OpenAI
El Agents SDK de OpenAI usa un patrón de herramienta similar al de la API de function calling pero con una orquestación más rica. Defines las herramientas como funciones con parámetros en JSON Schema, y el agente decide cuándo y cómo invocarlas.
User Query -> OpenAI Agent -> Tool Selection -> CrawlForge API -> Results -> Agent Response
La REST API de CrawlForge en https://crawlforge.dev/api/v1/tools/ se corresponde de forma limpia con el formato de definición de herramientas del Agents SDK. Cada herramienta se convierte en una función que el agente puede invocar.
Paso 1: Crea las funciones de herramienta de CrawlForge
Primero, crea un cliente de CrawlForge reutilizable y las definiciones de herramientas:
Paso 2: Crea un agente de investigación web
Crea un agente que use las herramientas de CrawlForge para investigar temas:
El agente hará de forma autónoma:
- Llamar a
search_webpara encontrar artículos relevantes (5 credits) - Llamar a
extract_contentsobre los mejores resultados (2 credits cada uno) - Sintetizar un resumen con citas
Paso 3: Añade extracción de datos estructurados
Crea un agente de extracción de datos que obtenga campos específicos de las páginas web:
Avanzado: pipeline web multiagente
El Agents SDK admite traspasos (handoffs) entre agentes especializados. Crea un pipeline donde un investigador encuentra las fuentes y las traspasa a un analista:
Este pipeline separa responsabilidades: el recolector reúne datos (usando credits de CrawlForge) y el analista los procesa (sin necesidad de credits). El coste total depende de las fuentes obtenidas: normalmente 15-25 credits para una comparativa de 3 fuentes.
Desglose del coste en credits
| Flujo de trabajo del agente | Herramientas usadas | Credits estimados |
|---|---|---|
| Búsqueda única + resumen | search_web + extract_content | 7 |
| Investigación de 3 fuentes | search_web + 3x extract_content | 11 |
| Extracción estructurada (1 página) | scrape_structured | 2 |
| Comparativa multiagente (3 fuentes) | search_web + 3x extract_content + scrape_structured | 15 |
| Informe de investigación profunda | deep_research | 10 |
El plan Free de CrawlForge (1.000 credits) admite aproximadamente 90 flujos de búsqueda y extracción al mes. El plan Professional ($99/mes, 50.000 credits) gestiona cargas de trabajo de agentes en producción.
Buenas prácticas
Elige primero la herramienta más barata. Las instrucciones del agente deberían guiarlo hacia fetch_url (1 credit) cuando el HTML completo sea aceptable, y extract_content (2 credits) solo cuando se necesite texto limpio. Reserva deep_research (10 credits) para consultas complejas de múltiples fuentes.
Limita los pasos del agente. Establece un número máximo de invocaciones de herramientas para controlar los costes. La mayoría de las tareas de investigación se completan en 3-5 llamadas a herramientas.
Usa traspasos para pipelines complejos. En lugar de un único agente con muchas herramientas, reparte responsabilidades. El agente recolector se encarga del acceso web (credits), mientras que el agente analista procesa los datos (sin credits).
Cachea las salidas de las herramientas. Si tu agente accede repetidamente a la misma URL, implementa caché de respuestas para evitar cargos de credits duplicados.
Monitoriza el uso. Revisa tu consumo de credits en el panel de CrawlForge y configura alertas ante picos inesperados.
Siguientes pasos
Ahora tienes agentes de OpenAI capaces de acceder a datos web en vivo. Sigue construyendo:
- Resumen de las 20 herramientas de CrawlForge: registra más herramientas para tus agentes
- Scraping en modo sigiloso: accede a sitios con protección anti-bot
- Automatización de investigación profunda: usa la herramienta deep_research de 10 credits para informes exhaustivos
- Inicio rápido de CrawlForge: guía completa de configuración de MCP
Dale a tus agentes de OpenAI ojos en la web. Empieza gratis con 1.000 credits: no se requiere tarjeta de crédito.