Dify es una plataforma de código abierto para el desarrollo de apps LLM que te permite crear aplicaciones de IA con un editor visual de flujos de trabajo. Al añadir CrawlForge como herramienta personalizada, tus flujos de trabajo de Dify obtienen la capacidad de hacer scraping de sitios web, buscar en la web y extraer datos estructurados, todo sin escribir código.

Esta guía cubre tanto el enfoque sin código (la configuración visual de herramientas de Dify) como el enfoque basado en API para integraciones avanzadas.

Tabla de contenidos

¿Qué es Dify?
Requisitos previos
Paso 1: Configura un proveedor de herramientas personalizadas
Paso 2: Define los esquemas de las herramientas de CrawlForge
Paso 3: Construye un flujo de trabajo de investigación web
Paso 4: Construye un pipeline de extracción de contenido
Paso 5: Maneja la autenticación y los errores
Referencia de costes en credits
Herramientas de CrawlForge disponibles en Dify
Próximos pasos

¿Qué es Dify?

Dify es una plataforma lista para producción para construir aplicaciones LLM. Ofrece un constructor visual de flujos de trabajo, orquestación de agentes, gestión de pipelines RAG y una biblioteca de más de 50 herramientas integradas. Dify admite la integración de herramientas personalizadas mediante especificaciones OpenAPI, lo que significa que cualquier API REST -- incluida CrawlForge -- puede añadirse como herramienta.

La integración MCP nativa de Dify también significa que puedes conectar CrawlForge como un MCP server directamente. Esta guía cubre ambos enfoques.

Requisitos previos

Instancia de Dify -- ya sea Dify Cloud o autohospedada vía Docker
Una cuenta de CrawlForge con una API key (1.000 credits gratis)
Acceso de administrador a tu espacio de trabajo de Dify

Paso 1: Configura un proveedor de herramientas personalizadas

En tu dashboard de Dify, navega a Tools > Custom Tools > Create Custom Tool.

Pega la siguiente especificación OpenAPI para registrar las herramientas principales de CrawlForge:

Yaml

openapi: "3.0.0"
info:
  title: CrawlForge Web Scraping Tools
  version: "1.0.0"
  description: "26 specialized web scraping tools for AI applications"
servers:
  - url: https://crawlforge.dev/api/v1/tools
paths:
  /extract_content:
    post:
      operationId: extractContent
      summary: Extract clean content from a URL (2 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url]
              properties:
                url:
                  type: string
                  description: The URL to extract content from
      responses:
        "200":
          description: Extracted content
  /search_web:
    post:
      operationId: searchWeb
      summary: Search the web via Google (5 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [query]
              properties:
                query:
                  type: string
                  description: Search query
                limit:
                  type: integer
                  description: Max results (default 10)
      responses:
        "200":
          description: Search results
  /fetch_url:
    post:
      operationId: fetchUrl
      summary: Fetch raw page content (1 credit)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url]
              properties:
                url:
                  type: string
                  description: The URL to fetch
      responses:
        "200":
          description: Raw page content
  /scrape_structured:
    post:
      operationId: scrapeStructured
      summary: Extract data with CSS selectors (2 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url, selectors]
              properties:
                url:
                  type: string
                selectors:
                  type: object
                  additionalProperties:
                    type: string
      responses:
        "200":
          description: Structured extraction results

Configura la autenticación como Bearer Token e introduce tu API key de CrawlForge (cf_live_...).

Paso 2: Define los esquemas de las herramientas de CrawlForge

Tras importar la especificación OpenAPI, Dify genera automáticamente tarjetas de herramienta para cada endpoint. Configura cada herramienta con nombres descriptivos para que el agente LLM pueda seleccionarlas correctamente:

Nombre de la herramienta en Dify	Endpoint de CrawlForge	Credits	Cuándo debería usarla el agente
Fetch Web Page	/fetch_url	1	El usuario proporciona una URL específica para leer
Extract Content	/extract_content	2	Se necesita texto limpio y legible de una página
Search the Web	/search_web	5	Se necesita encontrar páginas sobre un tema
Extract Structured Data	/scrape_structured	2	Se necesitan datos concretos mediante selectores CSS

Para cada herramienta en Dify, añade una descripción clara que incluya el coste en credits. Esto ayuda al agente LLM a tomar decisiones rentables.

Paso 3: Construye un flujo de trabajo de investigación web

En el editor de flujos de trabajo de Dify, crea un nuevo flujo de trabajo con estos nodos:

Typescript

// Pseudocode for the Dify workflow (implemented visually in Dify's editor)

// Node 1: Start -- User provides a research topic
// Input: { topic: string }

// Node 2: Search Web (5 credits)
// Tool: CrawlForge search_web
// Input: { query: "{{topic}} latest developments 2026", limit: 5 }
// Output: search_results

// Node 3: Extract Top Results (2 credits each)
// Tool: CrawlForge extract_content
// Loop over: search_results.results[0..2]
// Input: { url: "{{item.link}}" }
// Output: extracted_pages[]

// Node 4: LLM Synthesis
// Model: Claude Sonnet
// Prompt: "Synthesize these sources into a research brief: {{extracted_pages}}"
// Output: research_summary

// Node 5: End -- Return research_summary to user
// Total credits: 5 + (3 * 2) = 11 credits per run

El flujo de trabajo visual de Dify convierte esto en una operación de arrastrar y soltar. Cada nodo se conecta con el siguiente, con los datos fluyendo a través de variables de plantilla.

Paso 4: Construye un pipeline de extracción de contenido

Para tareas recurrentes de extracción de datos, construye un flujo de trabajo de pipeline:

Typescript

// Dify workflow for daily competitor monitoring

// Node 1: Start (triggered by schedule or API call)
// Input: { urls: ["https://competitor1.com/pricing", "https://competitor2.com/pricing"] }

// Node 2: Batch Extract (2 credits per URL)
// Tool: CrawlForge scrape_structured
// Loop over: urls
// Input: {
//   url: "{{item}}",
//   selectors: {
//     plans: ".pricing-plan h3",
//     prices: ".pricing-plan .price",
//     features: ".pricing-plan .feature-list"
//   }
// }
// Output: pricing_data[]

// Node 3: LLM Analysis
// Model: Claude Haiku (for cost efficiency)
// Prompt: "Compare these pricing pages and highlight any changes: {{pricing_data}}"
// Output: analysis

// Node 4: Conditional -- if changes detected, send notification
// Node 5: End
// Total: 2 * number_of_urls credits per run

Paso 5: Maneja la autenticación y los errores

Autenticación

CrawlForge usa autenticación por Bearer token. En Dify, configúralo una sola vez a nivel del proveedor de herramientas personalizadas:

Ve a Tools > Custom Tools > CrawlForge
Haz clic en Configure Authorization
Selecciona API Key (Bearer)
Introduce tu API key de CrawlForge

Todas las llamadas a herramientas dentro de los flujos de trabajo incluyen automáticamente la cabecera de autenticación.

Manejo de errores

Añade nodos de manejo de errores en tu flujo de trabajo de Dify para los escenarios habituales:

Typescript

// Error handling pattern for Dify workflows

// After each CrawlForge tool node, add a conditional:
// If response.status === 402 -> "Insufficient credits"
//   -> Notify user to top up at crawlforge.dev/pricing
// If response.status === 429 -> "Rate limited"
//   -> Wait 2 seconds, retry the node
// If response.status === 500 -> "Server error"
//   -> Log error, skip this URL, continue workflow

El mecanismo de reintento integrado de Dify maneja los fallos transitorios automáticamente. Para los errores por agotamiento de credits (HTTP 402), redirige a un nodo de notificación que avise al usuario.

Referencia de costes en credits

Credits	Herramientas	Caso de uso en el flujo de trabajo de Dify
1	fetch_url, extract_text, extract_links, extract_metadata	Disparadores simples de obtención de páginas
2	scrape_structured, extract_content, map_site, process_document, localization	Nodos de pipeline de extracción, flujos de auditoría de sitios
3	track_changes, analyze_content	Detección de cambios, análisis de contenido
4	summarize_content, crawl_deep	Generación de resúmenes, crawling multipágina
5	search_web, batch_scrape, scrape_with_actions, stealth_mode	Flujos de investigación y masivos
10	deep_research	Flujos de análisis exhaustivo

Herramientas de CrawlForge disponibles en Dify

Las 26 herramientas de CrawlForge pueden registrarse en Dify. Las más usadas en flujos de trabajo visuales son:

Herramienta	Credits	Por qué funciona bien en Dify
search_web	5	Punto de partida natural para flujos de investigación
extract_content	2	La salida limpia alimenta directamente los nodos LLM
scrape_structured	2	Los selectores CSS devuelven JSON predecible y estructurado
fetch_url	1	La opción más barata para el acceso simple a páginas
batch_scrape	5	Maneja los bucles de forma más eficiente que las llamadas individuales

Próximos pasos

Documentación de Dify -- documentación oficial de la plataforma Dify
Referencia de la API de CrawlForge -- esquemas de endpoints para las 26 herramientas
Guía completa de MCP -- entender la integración del protocolo MCP
Precios de CrawlForge -- packs de credits desde $19/mes

Añade web scraping a tus apps de Dify hoy. Obtén tu API key gratuita con 1.000 credits y registra CrawlForge como herramienta personalizada en Dify. Sin código.

Esta guía cubre tanto el enfoque sin código (la configuración visual de herramientas de Dify) como el enfoque basado en API para integraciones avanzadas.

Tabla de contenidos

¿Qué es Dify?
Requisitos previos
Paso 1: Configura un proveedor de herramientas personalizadas
Paso 2: Define los esquemas de las herramientas de CrawlForge
Paso 3: Construye un flujo de trabajo de investigación web
Paso 4: Construye un pipeline de extracción de contenido
Paso 5: Maneja la autenticación y los errores
Referencia de costes en credits
Herramientas de CrawlForge disponibles en Dify
Próximos pasos

¿Qué es Dify?

La integración MCP nativa de Dify también significa que puedes conectar CrawlForge como un MCP server directamente. Esta guía cubre ambos enfoques.

Requisitos previos

Instancia de Dify -- ya sea Dify Cloud o autohospedada vía Docker
Una cuenta de CrawlForge con una API key (1.000 credits gratis)
Acceso de administrador a tu espacio de trabajo de Dify

Paso 1: Configura un proveedor de herramientas personalizadas

En tu dashboard de Dify, navega a Tools > Custom Tools > Create Custom Tool.

Pega la siguiente especificación OpenAPI para registrar las herramientas principales de CrawlForge:

Yaml

openapi: "3.0.0"
info:
  title: CrawlForge Web Scraping Tools
  version: "1.0.0"
  description: "26 specialized web scraping tools for AI applications"
servers:
  - url: https://crawlforge.dev/api/v1/tools
paths:
  /extract_content:
    post:
      operationId: extractContent
      summary: Extract clean content from a URL (2 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url]
              properties:
                url:
                  type: string
                  description: The URL to extract content from
      responses:
        "200":
          description: Extracted content
  /search_web:
    post:
      operationId: searchWeb
      summary: Search the web via Google (5 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [query]
              properties:
                query:
                  type: string
                  description: Search query
                limit:
                  type: integer
                  description: Max results (default 10)
      responses:
        "200":
          description: Search results
  /fetch_url:
    post:
      operationId: fetchUrl
      summary: Fetch raw page content (1 credit)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url]
              properties:
                url:
                  type: string
                  description: The URL to fetch
      responses:
        "200":
          description: Raw page content
  /scrape_structured:
    post:
      operationId: scrapeStructured
      summary: Extract data with CSS selectors (2 credits)
      requestBody:
        required: true
        content:
          application/json:
            schema:
              type: object
              required: [url, selectors]
              properties:
                url:
                  type: string
                selectors:
                  type: object
                  additionalProperties:
                    type: string
      responses:
        "200":
          description: Structured extraction results

Configura la autenticación como Bearer Token e introduce tu API key de CrawlForge (cf_live_...).

Paso 2: Define los esquemas de las herramientas de CrawlForge

Nombre de la herramienta en Dify	Endpoint de CrawlForge	Credits	Cuándo debería usarla el agente
Fetch Web Page	/fetch_url	1	El usuario proporciona una URL específica para leer
Extract Content	/extract_content	2	Se necesita texto limpio y legible de una página
Search the Web	/search_web	5	Se necesita encontrar páginas sobre un tema
Extract Structured Data	/scrape_structured	2	Se necesitan datos concretos mediante selectores CSS

Para cada herramienta en Dify, añade una descripción clara que incluya el coste en credits. Esto ayuda al agente LLM a tomar decisiones rentables.

Paso 3: Construye un flujo de trabajo de investigación web

En el editor de flujos de trabajo de Dify, crea un nuevo flujo de trabajo con estos nodos:

Typescript

// Pseudocode for the Dify workflow (implemented visually in Dify's editor)

// Node 1: Start -- User provides a research topic
// Input: { topic: string }

// Node 2: Search Web (5 credits)
// Tool: CrawlForge search_web
// Input: { query: "{{topic}} latest developments 2026", limit: 5 }
// Output: search_results

// Node 3: Extract Top Results (2 credits each)
// Tool: CrawlForge extract_content
// Loop over: search_results.results[0..2]
// Input: { url: "{{item.link}}" }
// Output: extracted_pages[]

// Node 4: LLM Synthesis
// Model: Claude Sonnet
// Prompt: "Synthesize these sources into a research brief: {{extracted_pages}}"
// Output: research_summary

// Node 5: End -- Return research_summary to user
// Total credits: 5 + (3 * 2) = 11 credits per run

El flujo de trabajo visual de Dify convierte esto en una operación de arrastrar y soltar. Cada nodo se conecta con el siguiente, con los datos fluyendo a través de variables de plantilla.

Paso 4: Construye un pipeline de extracción de contenido

Para tareas recurrentes de extracción de datos, construye un flujo de trabajo de pipeline:

Typescript

// Dify workflow for daily competitor monitoring

// Node 1: Start (triggered by schedule or API call)
// Input: { urls: ["https://competitor1.com/pricing", "https://competitor2.com/pricing"] }

// Node 2: Batch Extract (2 credits per URL)
// Tool: CrawlForge scrape_structured
// Loop over: urls
// Input: {
//   url: "{{item}}",
//   selectors: {
//     plans: ".pricing-plan h3",
//     prices: ".pricing-plan .price",
//     features: ".pricing-plan .feature-list"
//   }
// }
// Output: pricing_data[]

// Node 3: LLM Analysis
// Model: Claude Haiku (for cost efficiency)
// Prompt: "Compare these pricing pages and highlight any changes: {{pricing_data}}"
// Output: analysis

// Node 4: Conditional -- if changes detected, send notification
// Node 5: End
// Total: 2 * number_of_urls credits per run

Paso 5: Maneja la autenticación y los errores

Autenticación

CrawlForge usa autenticación por Bearer token. En Dify, configúralo una sola vez a nivel del proveedor de herramientas personalizadas:

Ve a Tools > Custom Tools > CrawlForge
Haz clic en Configure Authorization
Selecciona API Key (Bearer)
Introduce tu API key de CrawlForge

Todas las llamadas a herramientas dentro de los flujos de trabajo incluyen automáticamente la cabecera de autenticación.

Manejo de errores

Añade nodos de manejo de errores en tu flujo de trabajo de Dify para los escenarios habituales:

Typescript

// Error handling pattern for Dify workflows

// After each CrawlForge tool node, add a conditional:
// If response.status === 402 -> "Insufficient credits"
//   -> Notify user to top up at crawlforge.dev/pricing
// If response.status === 429 -> "Rate limited"
//   -> Wait 2 seconds, retry the node
// If response.status === 500 -> "Server error"
//   -> Log error, skip this URL, continue workflow

Referencia de costes en credits

Credits	Herramientas	Caso de uso en el flujo de trabajo de Dify
1	fetch_url, extract_text, extract_links, extract_metadata	Disparadores simples de obtención de páginas
2	scrape_structured, extract_content, map_site, process_document, localization	Nodos de pipeline de extracción, flujos de auditoría de sitios
3	track_changes, analyze_content	Detección de cambios, análisis de contenido
4	summarize_content, crawl_deep	Generación de resúmenes, crawling multipágina
5	search_web, batch_scrape, scrape_with_actions, stealth_mode	Flujos de investigación y masivos
10	deep_research	Flujos de análisis exhaustivo

Herramientas de CrawlForge disponibles en Dify

Las 26 herramientas de CrawlForge pueden registrarse en Dify. Las más usadas en flujos de trabajo visuales son:

Herramienta	Credits	Por qué funciona bien en Dify
search_web	5	Punto de partida natural para flujos de investigación
extract_content	2	La salida limpia alimenta directamente los nodos LLM
scrape_structured	2	Los selectores CSS devuelven JSON predecible y estructurado
fetch_url	1	La opción más barata para el acceso simple a páginas
batch_scrape	5	Maneja los bucles de forma más eficiente que las llamadas individuales

Próximos pasos

Documentación de Dify -- documentación oficial de la plataforma Dify
Referencia de la API de CrawlForge -- esquemas de endpoints para las 26 herramientas
Guía completa de MCP -- entender la integración del protocolo MCP
Precios de CrawlForge -- packs de credits desde $19/mes

Añade web scraping a tus apps de Dify hoy. Obtén tu API key gratuita con 1.000 credits y registra CrawlForge como herramienta personalizada en Dify. Sin código.

En esta página

Tabla de contenidos

¿Qué es Dify?

Requisitos previos

Paso 1: Configura un proveedor de herramientas personalizadas

Paso 2: Define los esquemas de las herramientas de CrawlForge

Paso 3: Construye un flujo de trabajo de investigación web

Paso 4: Construye un pipeline de extracción de contenido

Paso 5: Maneja la autenticación y los errores

Autenticación

Manejo de errores

Referencia de costes en credits

Herramientas de CrawlForge disponibles en Dify

Próximos pasos

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Artículos relacionados

Cómo usar CrawlForge con Make y Zapier

Cómo usar CrawlForge con n8n: guía de automatización de flujos

Cómo usar CrawlForge con agentes de LangGraph

En esta página

Tabla de contenidos

¿Qué es Dify?

Requisitos previos

Paso 1: Configura un proveedor de herramientas personalizadas

Paso 2: Define los esquemas de las herramientas de CrawlForge

Paso 3: Construye un flujo de trabajo de investigación web

Paso 4: Construye un pipeline de extracción de contenido

Paso 5: Maneja la autenticación y los errores

Autenticación

Manejo de errores

Referencia de costes en credits

Herramientas de CrawlForge disponibles en Dify

Próximos pasos

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Artículos relacionados

Cómo usar CrawlForge con Make y Zapier

Cómo usar CrawlForge con n8n: guía de automatización de flujos

Cómo usar CrawlForge con agentes de LangGraph