¿Cuáles son las 26 herramientas de web scraping en CrawlForge MCP?

CrawlForge agrupa cuatro herramientas básicas (fetch_url, extract_text, extract_links, extract_metadata a 1 credit cada una), extractores estructurados como scrape_structured y extract_content (2 credits), herramientas avanzadas como crawl_deep, batch_scrape, search_web y stealth_mode (3-5 credits), y la herramienta deep_research impulsada por IA (10 credits) -- todo detrás de una única API key.

¿Por qué usar un solo MCP server en lugar de varias herramientas de scraping?

El scraping tradicional te obliga a combinar un cliente HTTP, un framework de automatización de navegador, un servicio de búsqueda, un extractor de contenido y un monitor de cambios. CrawlForge te da una API unificada con autenticación, precios y formatos de respuesta consistentes para que Claude pueda elegir de forma inteligente la herramienta adecuada para cada tarea.

¿Qué herramienta de CrawlForge es la más barata para obtener páginas simples?

Usa fetch_url (1 credit) para HTML crudo o extract_text (1 credit) para texto limpio y legible. Estas son las opciones más eficientes para contenido estático, endpoints de API y preparación de contexto para LLM -- reserva las herramientas más caras para los casos en los que las más baratas no funcionen.

¿Cuándo debería usar deep_research en lugar de search_web?

search_web devuelve resultados al estilo de Google, mientras que deep_research (10 credits) ejecuta verificación de múltiples fuentes con seguimiento de citas y detección de conflictos. Usa deep_research cuando necesites una respuesta sintetizada a partir de muchas fuentes, no solo una lista de enlaces.

¿Funcionan las 26 herramientas en el plan gratuito?

Sí. Cada plan, incluido el plan gratuito de 1.000 credits, tiene acceso a las 26 herramientas. Solo pagas por uso a través del sistema de credits, así que puedes experimentar con stealth_mode, deep_research y batch_scrape en el plan gratuito para encontrar lo que se ajusta a tu flujo de trabajo.

18 herramientas de web scraping en un MCP server: la guía completa de CrawlForge

El web scraping nunca ha sido tan crítico para las aplicaciones de IA. Ya sea que estés construyendo sistemas RAG, entrenando modelos o creando agentes inteligentes, necesitas acceso fiable a los datos de la web. CrawlForge MCP ofrece 26 herramientas especializadas en un solo paquete, diseñadas específicamente para desarrolladores que construyen con Claude y otros LLMs.

Por qué un solo MCP server lo cambia todo

Las soluciones tradicionales de scraping te obligan a combinar varias herramientas:

Un cliente HTTP básico para obtenciones simples
Un framework de automatización de navegador para sitios con mucho JavaScript
Un servicio aparte para la búsqueda
Otra herramienta para la extracción de contenido
Y otra más para monitorear cambios

Con CrawlForge, obtienes una API unificada con autenticación, precios y formatos de respuesta consistentes. Claude puede elegir de forma inteligente la herramienta adecuada para cada tarea.

La referencia completa de herramientas

Herramientas básicas (1 credit cada una)

Estas herramientas fundamentales manejan las tareas de scraping más comunes de forma eficiente:

fetch_url

La herramienta más simple: obtiene el HTML crudo de cualquier URL con manejo automático de redirecciones.

Bash

curl -X POST https://crawlforge.dev/api/v1/tools/fetch_url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"url": "https://example.com"}'

Ideal para: cargas iniciales de páginas, endpoints de API, contenido estático

extract_text

Elimina el HTML y devuelve contenido de texto limpio y legible.

Bash

curl -X POST https://crawlforge.dev/api/v1/tools/extract_text \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"url": "https://example.com/article"}'

Ideal para: análisis de contenido, contexto para LLM, procesamiento de texto

extract_links

Analiza todas las etiquetas de anclaje y devuelve datos de enlaces estructurados.

Ideal para: mapeo de sitios, semillas para crawlers, análisis SEO

extract_metadata

Extrae metadatos SEO, etiquetas Open Graph, Twitter cards y datos de Schema.org.

Ideal para: vistas previas de contenido, auditorías SEO, análisis de compartición social

Herramientas de extracción estructurada (2 credits cada una)

Cuando necesitas algo más que contenido crudo:

scrape_structured

Usa selectores CSS para extraer elementos específicos a JSON estructurado.

Typescript

{
  "url": "https://store.example.com/products",
  "selectors": {
    "title": "h1.product-title",
    "price": "span.price",
    "rating": "div.rating-stars"
  }
}

Ideal para: datos de e-commerce, listados, páginas estructuradas

extract_content

Extracción inteligente del contenido principal: elimina la navegación, los anuncios y el relleno.

Ideal para: artículos, posts de blog, páginas de documentación

map_site

Descubre y mapea la estructura de un sitio web, encontrando todas las URLs accesibles.

Typescript

{
  "url": "https://docs.example.com",
  "maxDepth": 3,
  "includePatterns": ["/docs/*"]
}

Ideal para: planificación previa al rastreo, indexación de documentación, generación de sitemaps

process_document

Extrae texto de PDFs y otros formatos de documento vía URL.

Ideal para: scraping de PDFs, procesamiento de documentos, artículos académicos

localization

Scraping geolocalizado con más de 26 proxies de países, suplantación de zona horaria y cabeceras de configuración regional.

Typescript

{
  "url": "https://store.example.com",
  "country": "UK",
  "language": "en-GB"
}

Ideal para: comparación de precios, contenido localizado, sitios con restricciones geográficas

Herramientas avanzadas (3-5 credits)

Para escenarios de scraping complejos:

analyze_content (3 credits)

Análisis de contenido impulsado por IA, incluyendo sentimiento, detección de idioma y extracción de temas.

Ideal para: análisis de sentimiento, clasificación de contenido, detección de idioma

stealth_mode (5 credits)

Navegación antidetección con aleatorización de huella digital y simulación de comportamiento humano -- las mismas técnicas que usa Playwright bajo el capó, con parches de sigilo aplicados.

Ideal para: sitios con detección de bots, páginas protegidas por Cloudflare

summarize_content (4 credits)

Resúmenes generados por IA con longitud y enfoque configurables.

Ideal para: resúmenes de contenido, síntesis de investigación, visiones generales rápidas

crawl_deep (4 credits)

Rastreo de varias páginas con control de profundidad, coincidencia de patrones y extracción de contenido. 4 credits fijos por llamada sin importar cuántas páginas se rastreen.

Typescript

{
  "url": "https://blog.example.com",
  "maxDepth": 2,
  "maxPages": 50,
  "extractContent": true
}

Ideal para: archivos de blog, sitios de documentación, indexación de sitios completos

scrape_with_actions (5 credits)

Automatización de navegador con capacidades de clic, escritura, scroll y captura de pantalla.

Typescript

{
  "url": "https://app.example.com/login",
  "actions": [
    {"type": "type", "selector": "#email", "text": "user@example.com"},
    {"type": "click", "selector": "button[type=submit]"},
    {"type": "wait", "timeout": 3000}
  ]
}

Ideal para: contenido protegido por login, formularios interactivos, navegación en SPAs

batch_scrape (5 credits)

Procesa múltiples URLs en paralelo con un formato de respuesta unificado. 5 credits fijos por llamada sin importar el número de URLs.

Typescript

{
  "urls": [
    "https://site1.com",
    "https://site2.com",
    "https://site3.com"
  ],
  "maxConcurrency": 10
}

Ideal para: recolección masiva de datos, scraping comparativo, eficiencia

search_web (5 credits)

Integración con Google Custom Search para descubrir URLs relevantes.

Ideal para: puntos de partida de investigación, descubrimiento de temas, análisis competitivo

track_changes (3 credits)

Monitorea sitios web en busca de cambios de contenido con sensibilidad configurable. 3 credits fijos por llamada.

Ideal para: monitoreo de competidores, seguimiento de precios, alertas de noticias

Herramienta de investigación con IA (10 credits)

deep_research

La herramienta más potente: investigación de varias etapas con verificación y síntesis de fuentes.

Typescript

{
  "topic": "Next.js 15 performance improvements",
  "depth": "moderate",
  "maxSources": 10
}

Devuelve:

Resumen sintetizado
Hallazgos clave con puntuaciones de confianza
Fuentes verificadas con ranking de relevancia
Detección de conflictos entre fuentes

Ideal para: inteligencia competitiva, investigación de mercado, investigación técnica, verificación de hechos

Consejos para optimizar credits

Empieza barato: usa fetch_url (1 credit) antes de probar herramientas caras
Agrupa cuando puedas: batch_scrape es más eficiente que las llamadas individuales
Conoce tus URLs: no uses search_web (5 credits) cuando ya tienes la URL
Cachea los resultados: misma URL = mismo contenido, no vuelvas a hacer scraping sin necesidad
Usa la herramienta adecuada: extract_content (2 credits) supera al parseo manual

Comparación de precios

Plan	Credits/mes	Precio	Costo por credit
Free	1,000	$0	-
Hobby	5,000	$19	$0.0038
Professional	50,000	$99	$0.00198
Business	250,000	$399	$0.00160

Empezar

Regístrate gratis en crawlforge.dev/signup
Obtén 1.000 credits al instante (sin tarjeta de crédito)
Añádelo a Claude Desktop en 5 minutos (guía)

¿Listo para empezar? Crea tu cuenta gratuita en crawlforge.dev y desbloquea las 26 herramientas hoy.

Por qué un solo MCP server lo cambia todo

Las soluciones tradicionales de scraping te obligan a combinar varias herramientas:

Un cliente HTTP básico para obtenciones simples
Un framework de automatización de navegador para sitios con mucho JavaScript
Un servicio aparte para la búsqueda
Otra herramienta para la extracción de contenido
Y otra más para monitorear cambios

Con CrawlForge, obtienes una API unificada con autenticación, precios y formatos de respuesta consistentes. Claude puede elegir de forma inteligente la herramienta adecuada para cada tarea.

La referencia completa de herramientas

Herramientas básicas (1 credit cada una)

Estas herramientas fundamentales manejan las tareas de scraping más comunes de forma eficiente:

fetch_url

La herramienta más simple: obtiene el HTML crudo de cualquier URL con manejo automático de redirecciones.

Bash

curl -X POST https://crawlforge.dev/api/v1/tools/fetch_url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"url": "https://example.com"}'

Ideal para: cargas iniciales de páginas, endpoints de API, contenido estático

extract_text

Elimina el HTML y devuelve contenido de texto limpio y legible.

Bash

curl -X POST https://crawlforge.dev/api/v1/tools/extract_text \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -d '{"url": "https://example.com/article"}'

Ideal para: análisis de contenido, contexto para LLM, procesamiento de texto

extract_links

Analiza todas las etiquetas de anclaje y devuelve datos de enlaces estructurados.

Ideal para: mapeo de sitios, semillas para crawlers, análisis SEO

extract_metadata

Extrae metadatos SEO, etiquetas Open Graph, Twitter cards y datos de Schema.org.

Ideal para: vistas previas de contenido, auditorías SEO, análisis de compartición social

Herramientas de extracción estructurada (2 credits cada una)

Cuando necesitas algo más que contenido crudo:

scrape_structured

Usa selectores CSS para extraer elementos específicos a JSON estructurado.

Typescript

{
  "url": "https://store.example.com/products",
  "selectors": {
    "title": "h1.product-title",
    "price": "span.price",
    "rating": "div.rating-stars"
  }
}

Ideal para: datos de e-commerce, listados, páginas estructuradas

extract_content

Extracción inteligente del contenido principal: elimina la navegación, los anuncios y el relleno.

Ideal para: artículos, posts de blog, páginas de documentación

map_site

Descubre y mapea la estructura de un sitio web, encontrando todas las URLs accesibles.

Typescript

{
  "url": "https://docs.example.com",
  "maxDepth": 3,
  "includePatterns": ["/docs/*"]
}

Ideal para: planificación previa al rastreo, indexación de documentación, generación de sitemaps

process_document

Extrae texto de PDFs y otros formatos de documento vía URL.

Ideal para: scraping de PDFs, procesamiento de documentos, artículos académicos

localization

Scraping geolocalizado con más de 26 proxies de países, suplantación de zona horaria y cabeceras de configuración regional.

Typescript

{
  "url": "https://store.example.com",
  "country": "UK",
  "language": "en-GB"
}

Ideal para: comparación de precios, contenido localizado, sitios con restricciones geográficas

Herramientas avanzadas (3-5 credits)

Para escenarios de scraping complejos:

analyze_content (3 credits)

Análisis de contenido impulsado por IA, incluyendo sentimiento, detección de idioma y extracción de temas.

Ideal para: análisis de sentimiento, clasificación de contenido, detección de idioma

stealth_mode (5 credits)

Navegación antidetección con aleatorización de huella digital y simulación de comportamiento humano -- las mismas técnicas que usa Playwright bajo el capó, con parches de sigilo aplicados.

Ideal para: sitios con detección de bots, páginas protegidas por Cloudflare

summarize_content (4 credits)

Resúmenes generados por IA con longitud y enfoque configurables.

Ideal para: resúmenes de contenido, síntesis de investigación, visiones generales rápidas

crawl_deep (4 credits)

Rastreo de varias páginas con control de profundidad, coincidencia de patrones y extracción de contenido. 4 credits fijos por llamada sin importar cuántas páginas se rastreen.

Typescript

{
  "url": "https://blog.example.com",
  "maxDepth": 2,
  "maxPages": 50,
  "extractContent": true
}

Ideal para: archivos de blog, sitios de documentación, indexación de sitios completos

scrape_with_actions (5 credits)

Automatización de navegador con capacidades de clic, escritura, scroll y captura de pantalla.

Typescript

{
  "url": "https://app.example.com/login",
  "actions": [
    {"type": "type", "selector": "#email", "text": "user@example.com"},
    {"type": "click", "selector": "button[type=submit]"},
    {"type": "wait", "timeout": 3000}
  ]
}

Ideal para: contenido protegido por login, formularios interactivos, navegación en SPAs

batch_scrape (5 credits)

Procesa múltiples URLs en paralelo con un formato de respuesta unificado. 5 credits fijos por llamada sin importar el número de URLs.

Typescript

{
  "urls": [
    "https://site1.com",
    "https://site2.com",
    "https://site3.com"
  ],
  "maxConcurrency": 10
}

Ideal para: recolección masiva de datos, scraping comparativo, eficiencia

search_web (5 credits)

Integración con Google Custom Search para descubrir URLs relevantes.

Ideal para: puntos de partida de investigación, descubrimiento de temas, análisis competitivo

track_changes (3 credits)

Monitorea sitios web en busca de cambios de contenido con sensibilidad configurable. 3 credits fijos por llamada.

Ideal para: monitoreo de competidores, seguimiento de precios, alertas de noticias

Herramienta de investigación con IA (10 credits)

deep_research

La herramienta más potente: investigación de varias etapas con verificación y síntesis de fuentes.

Typescript

{
  "topic": "Next.js 15 performance improvements",
  "depth": "moderate",
  "maxSources": 10
}

Devuelve:

Resumen sintetizado
Hallazgos clave con puntuaciones de confianza
Fuentes verificadas con ranking de relevancia
Detección de conflictos entre fuentes

Ideal para: inteligencia competitiva, investigación de mercado, investigación técnica, verificación de hechos

Consejos para optimizar credits

Empieza barato: usa fetch_url (1 credit) antes de probar herramientas caras
Agrupa cuando puedas: batch_scrape es más eficiente que las llamadas individuales
Conoce tus URLs: no uses search_web (5 credits) cuando ya tienes la URL
Cachea los resultados: misma URL = mismo contenido, no vuelvas a hacer scraping sin necesidad
Usa la herramienta adecuada: extract_content (2 credits) supera al parseo manual

Comparación de precios

Plan	Credits/mes	Precio	Costo por credit
Free	1,000	$0	-
Hobby	5,000	$19	$0.0038
Professional	50,000	$99	$0.00198
Business	250,000	$399	$0.00160

Empezar

Regístrate gratis en crawlforge.dev/signup
Obtén 1.000 credits al instante (sin tarjeta de crédito)
Añádelo a Claude Desktop en 5 minutos (guía)

¿Listo para empezar? Crea tu cuenta gratuita en crawlforge.dev y desbloquea las 26 herramientas hoy.

En esta página

Por qué un solo MCP server lo cambia todo

La referencia completa de herramientas

Herramientas básicas (1 credit cada una)

fetch_url

extract_text

extract_links

extract_metadata

Herramientas de extracción estructurada (2 credits cada una)

scrape_structured

extract_content

map_site

process_document

localization

Herramientas avanzadas (3-5 credits)

analyze_content (3 credits)

stealth_mode (5 credits)

summarize_content (4 credits)

crawl_deep (4 credits)

scrape_with_actions (5 credits)

batch_scrape (5 credits)

search_web (5 credits)

track_changes (3 credits)

Herramienta de investigación con IA (10 credits)

deep_research

Consejos para optimizar credits

Comparación de precios

Empezar

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Frequently Asked Questions

Artículos relacionados

CrawlForge v4.8.0: Claude Skills que se autoactivan

CrawlForge v4.2.2: nueva CLI + 3 herramientas para scraping con IA local

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA

En esta página

Por qué un solo MCP server lo cambia todo

La referencia completa de herramientas

Herramientas básicas (1 credit cada una)

fetch_url

extract_text

extract_links

extract_metadata

Herramientas de extracción estructurada (2 credits cada una)

scrape_structured

extract_content

map_site

process_document

localization

Herramientas avanzadas (3-5 credits)

analyze_content (3 credits)

stealth_mode (5 credits)

summarize_content (4 credits)

crawl_deep (4 credits)

scrape_with_actions (5 credits)

batch_scrape (5 credits)

search_web (5 credits)

track_changes (3 credits)

Herramienta de investigación con IA (10 credits)

deep_research

Consejos para optimizar credits

Comparación de precios

Empezar

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Frequently Asked Questions

Artículos relacionados

CrawlForge v4.8.0: Claude Skills que se autoactivan

CrawlForge v4.2.2: nueva CLI + 3 herramientas para scraping con IA local

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA