CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
Cómo hacer scraping de sitios web con Claude Code (guía 2026)
Tutorials
Volver al blog
Tutoriales

Cómo hacer scraping de sitios web con Claude Code (guía 2026)

C
CrawlForge Team
Equipo de Ingeniería
14 de abril de 2026
10 min de lectura

En esta página

Claude Code puede editar archivos, ejecutar comandos de shell y escribir tests, pero no puede obtener páginas web en vivo por sí solo. Conéctalo a CrawlForge MCP y gana 20 herramientas de scraping que se ejecutan directamente desde tu terminal.

Bash

Esta guía te muestra cómo hacer scraping de sitios web con Claude Code usando CrawlForge MCP, desde la instalación hasta el bypass en modo sigiloso. Cada bloque de código de abajo es ejecutable.

Tabla de contenidos

  • El problema: Claude Code no puede obtener URL
  • Requisitos previos
  • Paso 1: instala CrawlForge MCP
  • Paso 2: obtén tu API key
  • Paso 3: registra el MCP server en Claude Code
  • Paso 4: verifica la conexión
  • Paso 5: tu primer scrape
  • Ejemplo completo funcional: scraping de una página de precios
  • Avanzado: scraping de sitios renderizados con JavaScript
  • Solución de problemas
  • Preguntas frecuentes

El problema: Claude Code no puede obtener URL

Por defecto, Claude Code no tiene acceso a la red. Pídele que "lea esta entrada de blog" y te dirá que no puede abrir URL. El asistente integrado WebFetch existe en Claude Desktop, pero es limitado, tiene un tope de velocidad y a menudo lo bloquean Cloudflare, Akamai y otras protecciones de borde.

CrawlForge MCP resuelve esto exponiendo 20 herramientas de scraping -- fetch_url, extract_content, scrape_structured, stealth_mode, deep_research y más -- como herramientas del Model Context Protocol que Claude Code puede llamar como cualquier otra función. Para más contexto sobre el protocolo en sí, consulta nuestra guía completa de web scraping con MCP.

Requisitos previos

  • Node.js 18+ -- compruébalo con node --version
  • Claude Code -- instálalo con npm install -g @anthropic-ai/claude-code
  • Una cuenta de CrawlForge -- gratis en crawlforge.dev/signup (1,000 credits incluidos, sin tarjeta de crédito)

Paso 1: instala CrawlForge MCP

Bash

Verifica la instalación:

Bash

Paso 2: obtén tu API key

  1. Ve a crawlforge.dev/signup y crea una cuenta.
  2. Abre el dashboard en crawlforge.dev/dashboard/api-keys.
  3. Copia la key: empieza por cf_live_.

Paso 3: registra el MCP server en Claude Code

La vía más rápida es el asistente de configuración:

Bash

Escribe la entrada correcta en ~/.config/claude-code/mcp.json (Linux/macOS) o %APPDATA%\claude-code\mcp.json (Windows).

Si prefieres la configuración manual, añade esto a tu config de MCP de Claude Code:

Json

Reinicia Claude Code para que detecte el nuevo servidor.

Paso 4: verifica la conexión

Abre Claude Code y ejecuta:

/mcp

Deberías ver crawlforge en la lista como conectado con 20 herramientas disponibles. Si no, ve a Solución de problemas.

Paso 5: tu primer scrape

Pega este prompt en Claude Code:

Fetch https://news.ycombinator.com using CrawlForge and give me the top 5 story titles with their URLs as a JSON array.

Claude Code llamará a fetch_url (1 credit), parseará el HTML y devolverá algo como:

Json

Eso es todo. Ya estás haciendo scraping.

Ejemplo completo funcional: scraping de una página de precios

Aquí tienes una tarea realista: extraer los niveles de precios de un sitio SaaS. Pega este prompt:

Use scrape_structured to extract pricing from https://crawlforge.dev/pricing. Return an array of { plan, price, credits, features[] }.

Entre bastidores, Claude Code construye una petición como esta:

Typescript

Costo: 2 credits. Compáralo con ejecutar un navegador headless localmente: cero infraestructura, sin depurar Puppeteer, sin la ruleta de Cloudflare.

Avanzado: scraping de sitios renderizados con JavaScript

Algunos sitios renderizan los precios o los datos de producto mediante React del lado del cliente. fetch_url devuelve el esqueleto HTML previo a la hidratación y se pierde los datos. Cambia a scrape_with_actions (5 credits):

Typescript

Para sitios protegidos por Cloudflare y Akamai, usa stealth_mode (también 5 credits). Cubrimos las concesiones de la rotación de huellas en nuestro análisis profundo del modo sigiloso.

Referencia rápida de herramientas

HerramientaCreditsCuándo usarla
fetch_url1HTML estático, lo parsearás tú mismo
extract_text1Texto limpio y legible de páginas de artículos
extract_content2Extracción del contenido principal estilo legibilidad
scrape_structured2Selectores CSS a campos tipados
search_web5Aún no conoces la URL
scrape_with_actions5La SPA requiere clics, esperas, scroll
stealth_mode5Sistemas anti-bot (Cloudflare, DataDome)
deep_research10Investigación multifuente con citas

Lista completa en nuestro resumen de 20 herramientas.

Solución de problemas

"MCP server failed to start" -- Confirma que crawlforge-mcp-server está en tu PATH. Ejecuta which crawlforge-mcp-server. Si está vacío, reinstálalo globalmente: npm install -g crawlforge-mcp-server.

"Unauthorized" o errores 401 -- Tu API key falta o tiene un formato incorrecto. Debe empezar por cf_live_. Vuelve a exportarla en tu shell: export CRAWLFORGE_API_KEY="cf_live_..." y reinicia Claude Code.

"Insufficient credits" -- Comprueba el uso en crawlforge.dev/dashboard/usage. El nivel Free = 1,000 credits/mes. Mejora a Hobby ($19/mes) para 25,000.

La lista de herramientas está vacía en /mcp -- La config de MCP no se está leyendo. En macOS el archivo está en ~/Library/Application Support/claude-code/mcp.json. En Linux: ~/.config/claude-code/mcp.json. En Windows: %APPDATA%\claude-code\mcp.json.

Cloudflare 403 en cada fetch -- Cambia fetch_url por stealth_mode. Si te siguen bloqueando, el destino usa fingerprinting JA3/JA4 del lado del servidor; abre una incidencia en GitHub con la URL.

Preguntas frecuentes

Consulta la sección de preguntas frecuentes de abajo para respuestas rápidas a las preguntas más comunes.

Próximos pasos

  • Lee el inicio rápido de CrawlForge para cinco ejemplos de copiar y pegar
  • Explora la documentación de primeros pasos para la referencia completa de la API
  • Compara clientes MCP en Claude Desktop vs Claude Code
  • Evalúa alternativas en alternativa a Firecrawl

Empieza gratis con 1,000 credits en crawlforge.dev/signup. Sin tarjeta de crédito.

Etiquetas

Claude-Codeweb-scrapingMCPtutorialCLIAI-agentsgetting-started

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Frequently Asked Questions

¿Puede Claude Code hacer scraping de sitios web sin CrawlForge?+

No de forma fiable. Claude Code no tiene acceso a la red integrado, y el asistente WebFetch de Claude Desktop tiene un tope de velocidad y lo bloquean la mayoría de los sistemas anti-bot. CrawlForge MCP añade 20 herramientas de scraping dedicadas que manejan HTML estático, páginas renderizadas con JavaScript y sitios protegidos por Cloudflare.

¿Cuánto cuesta hacer scraping con Claude Code?+

CrawlForge usa un modelo de credits: los fetches básicos cuestan 1 credit, la extracción estructurada 2 credits, la búsqueda 5, el modo sigiloso 5 y la investigación profunda 10. Las cuentas gratuitas obtienen 1,000 credits al mes sin tarjeta de crédito. El plan Hobby ($19/mes) incluye 25,000 credits.

¿Por qué obtengo errores 403 cuando Claude Code obtiene ciertas URL?+

Los sitios protegidos por Cloudflare, DataDome o Akamai bloquean los clientes HTTP genéricos mediante fingerprinting de TLS y desafíos de JavaScript. Cambia de fetch_url (1 credit) a stealth_mode (5 credits), que rota las huellas del navegador y resuelve los desafíos automáticamente.

¿Funciona CrawlForge MCP con Claude Code en Windows?+

Sí. Instala vía npm, ejecuta npx crawlforge-setup y la config queda en %APPDATA%\\claude-code\\mcp.json. Node.js 18+ es el único requisito del sistema. Los usuarios de Windows deberían ejecutar el comando de configuración desde PowerShell o Windows Terminal para una experiencia más limpia.

¿Cuál es la diferencia entre fetch_url y scrape_with_actions?+

fetch_url devuelve HTML en bruto mediante una petición HTTP rápida (1 credit). scrape_with_actions levanta un navegador headless, ejecuta clics/esperas/scroll y luego captura el DOM hidratado (5 credits). Usa fetch_url para páginas estáticas y scrape_with_actions solo cuando se requiere renderizado de JavaScript.

Artículos relacionados

Inicio rápido de CrawlForge MCP: de cero al web scraping en 60 segundos
Tutorials

Inicio rápido de CrawlForge MCP: de cero al web scraping en 60 segundos

Instala CrawlForge MCP, consigue tu API key gratuita y ejecuta tu primer web scrape en menos de un minuto. Cinco ejemplos listos para copiar y pegar en Claude y Cursor.

C
CrawlForge Team
|
31 mar
|
3m
Cómo hacer scraping de sitios web en Cursor IDE con CrawlForge MCP
Tutorials

Cómo hacer scraping de sitios web en Cursor IDE con CrawlForge MCP

Convierte Cursor IDE en una estación de trabajo de web scraping. Conecta CrawlForge MCP y extrae datos estructurados de cualquier sitio sin salir de tu editor.

C
CrawlForge Team
|
14 abr
|
9m
Cómo hacer scraping de sitios web en Zed AI con CrawlForge MCP
Tutorials

Cómo hacer scraping de sitios web en Zed AI con CrawlForge MCP

Añade web scraping a Zed AI en 3 minutos. Configura CrawlForge MCP en Zed para que tu editor pueda obtener, extraer e investigar datos web en vivo bajo demanda.

C
CrawlForge Team
|
14 abr
|
9m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.