CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
Cómo usar CrawlForge con flujos de trabajo de Dify
Tutorials
Volver al blog
Tutoriales

Cómo usar CrawlForge con flujos de trabajo de Dify

C
CrawlForge Team
Equipo de Ingeniería
22 de abril de 2026
7 min de lectura

En esta página

Dify es una plataforma de código abierto para el desarrollo de apps LLM que te permite crear aplicaciones de IA con un editor visual de flujos de trabajo. Al añadir CrawlForge como herramienta personalizada, tus flujos de trabajo de Dify obtienen la capacidad de hacer scraping de sitios web, buscar en la web y extraer datos estructurados, todo sin escribir código.

Esta guía cubre tanto el enfoque sin código (la configuración visual de herramientas de Dify) como el enfoque basado en API para integraciones avanzadas.

Tabla de contenidos

  • ¿Qué es Dify?
  • Requisitos previos
  • Paso 1: Configura un proveedor de herramientas personalizadas
  • Paso 2: Define los esquemas de las herramientas de CrawlForge
  • Paso 3: Construye un flujo de trabajo de investigación web
  • Paso 4: Construye un pipeline de extracción de contenido
  • Paso 5: Maneja la autenticación y los errores
  • Referencia de costes en credits
  • Herramientas de CrawlForge disponibles en Dify
  • Próximos pasos

¿Qué es Dify?

Dify es una plataforma lista para producción para construir aplicaciones LLM. Ofrece un constructor visual de flujos de trabajo, orquestación de agentes, gestión de pipelines RAG y una biblioteca de más de 50 herramientas integradas. Dify admite la integración de herramientas personalizadas mediante especificaciones OpenAPI, lo que significa que cualquier API REST -- incluida CrawlForge -- puede añadirse como herramienta.

La integración MCP nativa de Dify también significa que puedes conectar CrawlForge como un MCP server directamente. Esta guía cubre ambos enfoques.

Requisitos previos

  • Instancia de Dify -- ya sea Dify Cloud o autohospedada vía Docker
  • Una cuenta de CrawlForge con una API key (1.000 credits gratis)
  • Acceso de administrador a tu espacio de trabajo de Dify

Paso 1: Configura un proveedor de herramientas personalizadas

En tu dashboard de Dify, navega a Tools > Custom Tools > Create Custom Tool.

Pega la siguiente especificación OpenAPI para registrar las herramientas principales de CrawlForge:

Yaml

Configura la autenticación como Bearer Token e introduce tu API key de CrawlForge (cf_live_...).

Paso 2: Define los esquemas de las herramientas de CrawlForge

Tras importar la especificación OpenAPI, Dify genera automáticamente tarjetas de herramienta para cada endpoint. Configura cada herramienta con nombres descriptivos para que el agente LLM pueda seleccionarlas correctamente:

Nombre de la herramienta en DifyEndpoint de CrawlForgeCreditsCuándo debería usarla el agente
Fetch Web Page/fetch_url1El usuario proporciona una URL específica para leer
Extract Content/extract_content2Se necesita texto limpio y legible de una página
Search the Web/search_web5Se necesita encontrar páginas sobre un tema
Extract Structured Data/scrape_structured2Se necesitan datos concretos mediante selectores CSS

Para cada herramienta en Dify, añade una descripción clara que incluya el coste en credits. Esto ayuda al agente LLM a tomar decisiones rentables.

Paso 3: Construye un flujo de trabajo de investigación web

En el editor de flujos de trabajo de Dify, crea un nuevo flujo de trabajo con estos nodos:

Typescript

El flujo de trabajo visual de Dify convierte esto en una operación de arrastrar y soltar. Cada nodo se conecta con el siguiente, con los datos fluyendo a través de variables de plantilla.

Paso 4: Construye un pipeline de extracción de contenido

Para tareas recurrentes de extracción de datos, construye un flujo de trabajo de pipeline:

Typescript

Paso 5: Maneja la autenticación y los errores

Autenticación

CrawlForge usa autenticación por Bearer token. En Dify, configúralo una sola vez a nivel del proveedor de herramientas personalizadas:

  1. Ve a Tools > Custom Tools > CrawlForge
  2. Haz clic en Configure Authorization
  3. Selecciona API Key (Bearer)
  4. Introduce tu API key de CrawlForge

Todas las llamadas a herramientas dentro de los flujos de trabajo incluyen automáticamente la cabecera de autenticación.

Manejo de errores

Añade nodos de manejo de errores en tu flujo de trabajo de Dify para los escenarios habituales:

Typescript

El mecanismo de reintento integrado de Dify maneja los fallos transitorios automáticamente. Para los errores por agotamiento de credits (HTTP 402), redirige a un nodo de notificación que avise al usuario.

Referencia de costes en credits

CreditsHerramientasCaso de uso en el flujo de trabajo de Dify
1fetch_url, extract_text, extract_links, extract_metadataDisparadores simples de obtención de páginas
2scrape_structured, extract_content, map_site, process_document, localizationNodos de pipeline de extracción, flujos de auditoría de sitios
3track_changes, analyze_contentDetección de cambios, análisis de contenido
4summarize_content, crawl_deepGeneración de resúmenes, crawling multipágina
5search_web, batch_scrape, scrape_with_actions, stealth_modeFlujos de investigación y masivos
10deep_researchFlujos de análisis exhaustivo

Herramientas de CrawlForge disponibles en Dify

Las 20 herramientas de CrawlForge pueden registrarse en Dify. Las más usadas en flujos de trabajo visuales son:

HerramientaCreditsPor qué funciona bien en Dify
search_web5Punto de partida natural para flujos de investigación
extract_content2La salida limpia alimenta directamente los nodos LLM
scrape_structured2Los selectores CSS devuelven JSON predecible y estructurado
fetch_url1La opción más barata para el acceso simple a páginas
batch_scrape5Maneja los bucles de forma más eficiente que las llamadas individuales

Próximos pasos

  • Documentación de Dify -- documentación oficial de la plataforma Dify
  • Referencia de la API de CrawlForge -- esquemas de endpoints para las 20 herramientas
  • Guía completa de MCP -- entender la integración del protocolo MCP
  • Precios de CrawlForge -- packs de credits desde $19/mes

Añade web scraping a tus apps de Dify hoy. Obtén tu API key gratuita con 1.000 credits y registra CrawlForge como herramienta personalizada en Dify. Sin código.

Etiquetas

difyllm-platformmcpintegrationtutorialno-codeweb-scrapingworkflow

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Artículos relacionados

Cómo usar CrawlForge con Make y Zapier
Tutorials

Cómo usar CrawlForge con Make y Zapier

Conecta CrawlForge a Make (Integromat) y Zapier para automatizar el web scraping. Configuración sin código con módulos HTTP, webhooks y ejemplos de flujos de trabajo.

C
CrawlForge Team
|
23 abr
|
8m
Cómo usar CrawlForge con n8n: guía de automatización de flujos
Tutorials

Cómo usar CrawlForge con n8n: guía de automatización de flujos

Conecta CrawlForge MCP a n8n para flujos de web scraping automatizados. Crea pipelines sin código que extraen, transforman y cargan datos web de forma programada.

C
CrawlForge Team
|
5 abr
|
7m
Cómo usar CrawlForge con agentes de LangGraph
Tutorials

Cómo usar CrawlForge con agentes de LangGraph

Construye agentes de web scraping con estado usando LangGraph y CrawlForge. Guía en TypeScript que cubre nodos del grafo, gestión de estado y flujos de scraping condicionales.

C
CrawlForge Team
|
24 abr
|
8m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.