En esta página
El web scraping nunca ha sido tan crítico para las aplicaciones de IA. Ya sea que estés construyendo sistemas RAG, entrenando modelos o creando agentes inteligentes, necesitas acceso fiable a los datos de la web. CrawlForge MCP ofrece 20 herramientas especializadas en un solo paquete, diseñadas específicamente para desarrolladores que construyen con Claude y otros LLMs.
Por qué un solo MCP server lo cambia todo
Las soluciones tradicionales de scraping te obligan a combinar varias herramientas:
- Un cliente HTTP básico para obtenciones simples
- Un framework de automatización de navegador para sitios con mucho JavaScript
- Un servicio aparte para la búsqueda
- Otra herramienta para la extracción de contenido
- Y otra más para monitorear cambios
Con CrawlForge, obtienes una API unificada con autenticación, precios y formatos de respuesta consistentes. Claude puede elegir de forma inteligente la herramienta adecuada para cada tarea.
La referencia completa de herramientas
Herramientas básicas (1 credit cada una)
Estas herramientas fundamentales manejan las tareas de scraping más comunes de forma eficiente:
fetch_url
La herramienta más simple: obtiene el HTML crudo de cualquier URL con manejo automático de redirecciones.
Ideal para: cargas iniciales de páginas, endpoints de API, contenido estático
extract_text
Elimina el HTML y devuelve contenido de texto limpio y legible.
Ideal para: análisis de contenido, contexto para LLM, procesamiento de texto
extract_links
Analiza todas las etiquetas de anclaje y devuelve datos de enlaces estructurados.
Ideal para: mapeo de sitios, semillas para crawlers, análisis SEO
extract_metadata
Extrae metadatos SEO, etiquetas Open Graph, Twitter cards y datos de Schema.org.
Ideal para: vistas previas de contenido, auditorías SEO, análisis de compartición social
Herramientas de extracción estructurada (2 credits cada una)
Cuando necesitas algo más que contenido crudo:
scrape_structured
Usa selectores CSS para extraer elementos específicos a JSON estructurado.
Ideal para: datos de e-commerce, listados, páginas estructuradas
extract_content
Extracción inteligente del contenido principal: elimina la navegación, los anuncios y el relleno.
Ideal para: artículos, posts de blog, páginas de documentación
map_site
Descubre y mapea la estructura de un sitio web, encontrando todas las URLs accesibles.
Ideal para: planificación previa al rastreo, indexación de documentación, generación de sitemaps
process_document
Extrae texto de PDFs y otros formatos de documento vía URL.
Ideal para: scraping de PDFs, procesamiento de documentos, artículos académicos
localization
Scraping geolocalizado con más de 26 proxies de países, suplantación de zona horaria y cabeceras de configuración regional.
Ideal para: comparación de precios, contenido localizado, sitios con restricciones geográficas
Herramientas avanzadas (3-5 credits)
Para escenarios de scraping complejos:
analyze_content (3 credits)
Análisis de contenido impulsado por IA, incluyendo sentimiento, detección de idioma y extracción de temas.
Ideal para: análisis de sentimiento, clasificación de contenido, detección de idioma
stealth_mode (5 credits)
Navegación antidetección con aleatorización de huella digital y simulación de comportamiento humano -- las mismas técnicas que usa Playwright bajo el capó, con parches de sigilo aplicados.
Ideal para: sitios con detección de bots, páginas protegidas por Cloudflare
summarize_content (4 credits)
Resúmenes generados por IA con longitud y enfoque configurables.
Ideal para: resúmenes de contenido, síntesis de investigación, visiones generales rápidas
crawl_deep (4 credits)
Rastreo de varias páginas con control de profundidad, coincidencia de patrones y extracción de contenido. 4 credits fijos por llamada sin importar cuántas páginas se rastreen.
Ideal para: archivos de blog, sitios de documentación, indexación de sitios completos
scrape_with_actions (5 credits)
Automatización de navegador con capacidades de clic, escritura, scroll y captura de pantalla.
Ideal para: contenido protegido por login, formularios interactivos, navegación en SPAs
batch_scrape (5 credits)
Procesa múltiples URLs en paralelo con un formato de respuesta unificado. 5 credits fijos por llamada sin importar el número de URLs.
Ideal para: recolección masiva de datos, scraping comparativo, eficiencia
search_web (5 credits)
Integración con Google Custom Search para descubrir URLs relevantes.
Ideal para: puntos de partida de investigación, descubrimiento de temas, análisis competitivo
track_changes (3 credits)
Monitorea sitios web en busca de cambios de contenido con sensibilidad configurable. 3 credits fijos por llamada.
Ideal para: monitoreo de competidores, seguimiento de precios, alertas de noticias
Herramienta de investigación con IA (10 credits)
deep_research
La herramienta más potente: investigación de varias etapas con verificación y síntesis de fuentes.
Devuelve:
- Resumen sintetizado
- Hallazgos clave con puntuaciones de confianza
- Fuentes verificadas con ranking de relevancia
- Detección de conflictos entre fuentes
Ideal para: inteligencia competitiva, investigación de mercado, investigación técnica, verificación de hechos
Consejos para optimizar credits
- Empieza barato: usa
fetch_url(1 credit) antes de probar herramientas caras - Agrupa cuando puedas:
batch_scrapees más eficiente que las llamadas individuales - Conoce tus URLs: no uses
search_web(5 credits) cuando ya tienes la URL - Cachea los resultados: misma URL = mismo contenido, no vuelvas a hacer scraping sin necesidad
- Usa la herramienta adecuada:
extract_content(2 credits) supera al parseo manual
Comparación de precios
| Plan | Credits/mes | Precio | Costo por credit |
|---|---|---|---|
| Free | 1,000 | $0 | - |
| Hobby | 5,000 | $19 | $0.0038 |
| Professional | 50,000 | $99 | $0.00198 |
| Business | 250,000 | $399 | $0.00160 |
Empezar
- Regístrate gratis en crawlforge.dev/signup
- Obtén 1.000 credits al instante (sin tarjeta de crédito)
- Añádelo a Claude Desktop en 5 minutos (guía)
¿Listo para empezar? Crea tu cuenta gratuita en crawlforge.dev y desbloquea las 20 herramientas hoy.