En esta página
Si alguna vez has deseado que Claude pudiera obtener datos en tiempo real de la web, buscar información o extraer contenido de sitios web, estás en el lugar correcto. Con el Model Context Protocol (MCP), puedes dar a Claude Desktop capacidades nativas de web scraping en solo unos minutos.
Por qué Claude necesita acceso a la web
Claude es potente para el análisis, la escritura y el razonamiento, pero está entrenado con datos que tienen una fecha de corte de conocimiento. Sin acceso a la web, Claude no puede:
- Investigar eventos actuales o precios
- Obtener documentación de sitios web externos
- Extraer datos de sitios de la competencia
- Verificar información en tiempo real
- Agregar contenido de múltiples fuentes
Ahí es donde entra el MCP.
¿Qué es el MCP?
El Model Context Protocol (MCP) es el estándar abierto de Anthropic para conectar asistentes de IA como Claude a herramientas y fuentes de datos externas. Piénsalo como un sistema de plugins para Claude Desktop.
En lugar de que Claude esté limitado a sus datos de entrenamiento, los MCP servers pueden:
- Obtener datos en vivo de APIs y sitios web
- Ejecutar acciones como web scraping, consultas a bases de datos u operaciones con archivos
- Proporcionar herramientas que Claude puede invocar de forma inteligente según tus prompts
CrawlForge MCP es un MCP server especializado que da a Claude 20 potentes herramientas de web scraping, desde la obtención básica de URLs hasta la investigación impulsada por IA.
Requisitos previos
Antes de empezar, asegúrate de tener:
- Claude Desktop instalado (descárgalo aquí)
- Node.js 18+ instalado (nodejs.org)
- Una cuenta gratuita de CrawlForge con 1.000 credits (regístrate aquí)
Eso es todo. No se requiere programar.
Paso 1: Consigue tu API key
Primero necesitamos una API key para autenticar las peticiones a CrawlForge:
- Ve a crawlforge.dev y crea una cuenta gratuita
- Obtendrás 1.000 credits gratis para empezar (no se requiere tarjeta de crédito)
- Navega a Dashboard → API Keys
- Haz clic en "Create API Key"
- Dale un nombre (por ejemplo, "Claude Desktop")
- Copia la API key (empieza por
cf_live_)
⚠️ Importante: Guarda esta clave en un lugar seguro. Solo la verás una vez.
Paso 2: Configura Claude Desktop
Ahora añadiremos CrawlForge al archivo de configuración MCP de Claude.
Encuentra tu archivo de configuración
La ubicación depende de tu sistema operativo:
macOS:
Windows:
Linux:
Añade el CrawlForge MCP server
Abre el archivo en tu editor de texto y añade esta configuración:
Reemplaza cf_live_YOUR_API_KEY_HERE con la API key que copiaste en el Paso 1.
Si ya tienes otros MCP servers configurados, simplemente añade la entrada "crawlforge" al objeto "mcpServers" existente.
Paso 3: Reinicia y prueba
- Cierra Claude Desktop por completo (haz clic derecho en el icono y selecciona "Quit")
- Vuelve a abrir Claude Desktop
- Deberías ver un pequeño icono de herramientas (🔧) en la caja de entrada, lo que indica que las MCP tools están cargadas
Para probarlo, intenta este prompt:
Fetch the homepage of example.com and extract its text content
Claude usará automáticamente la herramienta fetch_url (1 credit) para obtener la página, y luego extract_text (1 credit) para analizar el contenido. Deberías ver el texto completo de example.com en la respuesta.
5 ejemplos prácticos
Ahora que CrawlForge está conectado, esto es lo que puedes hacer:
1. Obtener una página web
Get me the HTML from https://news.ycombinator.com
Claude usa fetch_url (1 credit) para recuperar el HTML en bruto.
2. Extraer el contenido de un artículo
Extract the main content from this article: https://example.com/blog/post
Claude usa extract_content (2 credits) para identificar y extraer solo el texto del artículo, eliminando anuncios y navegación.
3. Obtener todos los enlaces
Find all external links on https://crawlforge.dev
Claude usa extract_links (1 credit) para analizar todas las etiquetas <a> y devolver las URLs.
4. Analizar los metadatos de una página
What's the SEO metadata for https://github.com/trending?
Claude usa extract_metadata (1 credit) para extraer etiquetas de título, meta descripciones, datos de Open Graph y más.
5. Investigar un tema
Research "Next.js 16 new features" and summarize the top 5 findings with sources
Claude usa deep_research (10 credits) para:
- Buscar en múltiples fuentes
- Extraer contenido relevante
- Verificar información
- Sintetizar un resumen con citas
Esta es la herramienta más potente para tareas de investigación exhaustiva.
Resumen de las herramientas disponibles
CrawlForge da a Claude acceso a 20 herramientas especializadas organizadas por coste en credits:
Herramientas básicas (1 credit cada una)
- fetch_url - Obtiene el HTML en bruto de cualquier URL
- extract_text - Extracción de texto limpio
- extract_links - Obtiene todos los enlaces de una página
- extract_metadata - Etiquetas de SEO y redes sociales
Extracción estructurada (2 credits)
- scrape_structured - Extracción basada en selectores CSS
- extract_content - Extracción del contenido principal (artículos, entradas de blog)
- map_site - Mapeo de la estructura del sitio web
- process_document - Extrae texto de PDFs y documentos
- localization - Scraping geolocalizado (26 países)
Herramientas avanzadas (3-5 credits)
- track_changes (3 credits) - Rastrea los cambios de un sitio web a lo largo del tiempo
- analyze_content (3 credits) - Análisis de sentimiento, detección de idioma
- summarize_content (4 credits) - Resumen impulsado por IA
- crawl_deep (4 credits) - Rastreo de múltiples páginas con control de profundidad
- stealth_mode (5 credits) - Navegación antidetección
- scrape_with_actions (5 credits) - Automatización del navegador (clics, formularios)
- batch_scrape (5 credits) - Procesa múltiples URLs en paralelo
- search_web (5 credits) - Integración con Google Custom Search
Investigación con IA (10 credits)
- deep_research - Investigación multietapa con verificación de fuentes y síntesis
Uso de credits
Cada llamada a una herramienta deduce credits de tu cuenta:
- Plan gratuito: 1.000 credits (suficiente para ~100-500 operaciones según las herramientas usadas)
- Hobby: 5.000 credits/mes por $19
- Professional: 50.000 credits/mes por $99
- Business: 250.000 credits/mes por $399
Puedes monitorizar el uso en el dashboard.
Consejos para un uso eficiente
- Empieza barato: Usa
fetch_url(1 credit) en lugar desearch_web(5 credits) cuando conozcas la URL - Agrupa peticiones: Usa
batch_scrapepara múltiples URLs en lugar de llamadas separadas - Cachea resultados: Si necesitas los mismos datos varias veces, guárdalos en tu conversación
- Usa la herramienta adecuada: No uses
deep_research(10 credits) para búsquedas simples
Solución de problemas
Error "No tools found":
- Asegúrate de cerrar Claude Desktop por completo (no solo cerrar la ventana)
- Comprueba que tu API key es válida (pruébala en crawlforge.dev/dashboard/keys)
- Verifica la sintaxis JSON de tu archivo de configuración
Error "Insufficient credits":
- Comprueba tu saldo en crawlforge.dev/dashboard
- Mejora tu plan o compra credits adicionales
Las llamadas a herramientas fallan:
- Algunos sitios web bloquean el scraping; prueba
stealth_mode(5 credits) para mejores tasas de éxito - Revisa el
robots.txtdel sitio web por si hay restricciones - Verifica que la URL es correcta y accesible
¿Qué sigue?
Ahora que tienes el web scraping habilitado en Claude Desktop, puedes:
- Crear flujos de trabajo de investigación que agregan datos de múltiples fuentes
- Monitorizar sitios web de la competencia en busca de cambios
- Extraer datos estructurados para análisis
- Automatizar la recopilación de contenido para datasets de entrenamiento de IA
Para un uso más avanzado, echa un vistazo a:
- Documentación de la API - Usa CrawlForge de forma programática
- Guías de herramientas - Documentación detallada de cada herramienta
- Ejemplos de integración - LangChain, LlamaIndex y más
¿Listo para mejorar tu plan? Ver planes de precios o contacta con soporte para soluciones empresariales personalizadas.
Pruébalo ahora: Regístrate gratis en crawlforge.dev/signup y consigue 1.000 credits para empezar.