En esta página
LangGraph es el framework de LangChain para construir agentes de IA con estado basados en grafos. Al integrar las herramientas de CrawlForge como nodos del grafo, puedes construir agentes que toman decisiones inteligentes sobre qué hacer scraping, cuándo profundizar y cómo sintetizar datos web a lo largo de múltiples pasos.
Esta guía te muestra cómo construir un agente de scraping completo con LangGraph y CrawlForge en TypeScript.
Tabla de contenidos
- ¿Qué es LangGraph?
- Requisitos previos
- Paso 1: configuración del proyecto
- Paso 2: definir herramientas de CrawlForge para LangGraph
- Paso 3: diseñar el estado del agente
- Paso 4: construir los nodos del grafo
- Paso 5: conectar el grafo
- Paso 6: ejecutar el agente
- Referencia de costes en credits
- LangGraph frente a LangChain directo para scraping
- Próximos pasos
¿Qué es LangGraph?
LangGraph es un framework de orquestación de bajo nivel para construir agentes de IA fiables. A diferencia de las arquitecturas simples basadas en cadenas, LangGraph modela la lógica del agente como un grafo dirigido donde:
- Los nodos representan acciones (llamadas a herramientas, invocaciones del LLM, procesamiento de datos)
- Las aristas definen las transiciones entre nodos, incluido el enrutamiento condicional
- El estado persiste durante toda la ejecución del grafo
Esta arquitectura es ideal para los agentes de scraping porque el web scraping implica decisiones de forma inherente: ¿Debería profundizar más? ¿Está bloqueada esta página? ¿Necesito cambiar al modo sigiloso? LangGraph te permite modelar estas decisiones como aristas condicionales en un grafo.
Requisitos previos
- Node.js 18+ y TypeScript 5+
- Una cuenta de CrawlForge con una API key (1.000 credits gratuitos)
- Familiaridad con los conceptos básicos de LangChain
Paso 1: configuración del proyecto
Crea tsconfig.json:
Añade tus API keys a .env:
Paso 2: definir herramientas de CrawlForge para LangGraph
Crea wrappers de herramientas tipados que LangGraph pueda invocar:
Paso 3: diseñar el estado del agente
Los agentes de LangGraph mantienen el estado durante la ejecución del grafo. Define una forma de estado que rastree el progreso del scraping:
Paso 4: construir los nodos del grafo
Cada nodo del grafo realiza una acción específica y actualiza el estado:
Paso 5: conectar el grafo
Conecta los nodos con aristas y enrutamiento condicional:
Paso 6: ejecutar el agente
Ejecútalo:
El agente buscará en la web, descubrirá páginas relevantes, extraerá contenido de los resultados más prometedores y sintetizará una comparación, todo ello mientras rastrea el uso de credits en el estado del grafo.
Referencia de costes en credits
| Credits | Herramientas | Rol del nodo en LangGraph |
|---|---|---|
| 1 | fetch_url, extract_text, extract_links, extract_metadata | Nodos ligeros de recopilación de datos |
| 2 | scrape_structured, extract_content, map_site, process_document, localization | Nodos de extracción, descubrimiento y procesamiento de documentos |
| 3 | track_changes, analyze_content | Nodos de seguimiento de cambios y análisis |
| 4 | summarize_content, crawl_deep | Nodos de resumen y crawling multipágina |
| 5 | search_web, batch_scrape, scrape_with_actions, stealth_mode | Nodos de investigación y operaciones masivas |
| 10 | deep_research | Análisis exhaustivo (úsalo como un subgrafo de un solo nodo) |
Ejecución típica de un agente de LangGraph: 5 (búsqueda) + 6 (3 extracciones) + 0 (análisis del LLM) = 11 credits.
LangGraph frente a LangChain directo para scraping
| Aspecto | LangGraph | LangChain directo |
|---|---|---|
| Gestión de estado | Integrada, tipada, persistente | Manual, requiere código personalizado |
| Lógica condicional | Aristas condicionales de primera clase | If/else en funciones de cadena |
| Seguimiento de credits | Rastreado automáticamente en el estado del grafo | Contador manual |
| Recuperación de errores | Enruta los errores a nodos de respaldo | Try/catch en la cadena |
| Complejidad | Mayor configuración inicial | Más simple para flujos lineales |
| Mejor para | Investigación multipaso con lógica de ramificación | Pipelines simples de obtener y procesar |
Usa LangGraph cuando tu agente de scraping necesite tomar decisiones basadas en resultados intermedios. Usa LangChain directo (consulta nuestra guía de integración con LangChain) cuando el flujo de trabajo sea lineal.
Próximos pasos
- Documentación de LangGraph -- guías oficiales de LangGraph
- 5 formas de usar CrawlForge con LangChain -- patrones más simples de LangChain
- Construye un asistente de investigación -- arquitectura de agente relacionada
- Referencia de la API de CrawlForge -- documentación completa de los endpoints de las herramientas
Construye hoy mismo agentes de scraping inteligentes. Regístrate en CrawlForge con 1.000 credits gratuitos, conecta las herramientas a tu grafo de LangGraph y deja que tu agente decida qué hacer scraping a continuación.