CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
Cómo hacer scraping de sitios web en Cursor IDE con CrawlForge MCP
Tutorials
Volver al blog
Tutoriales

Cómo hacer scraping de sitios web en Cursor IDE con CrawlForge MCP

C
CrawlForge Team
Equipo de Ingeniería
14 de abril de 2026
9 min de lectura

En esta página

Cursor IDE es excelente razonando sobre tu código, pero no puede ver la web en vivo. Añade CrawlForge a través de la integración con el Model Context Protocol de Cursor y el Composer gana 20 herramientas de scraping: sin script de Python, sin curl, sin salir del editor.

Json

Esta guía recorre paso a paso la configuración del web scraping en Cursor IDE, con ejemplos ejecutables para investigación, extracción estructurada y monitorización de la competencia.

Índice

  • ¿Por qué hacer scraping dentro de Cursor?
  • Requisitos previos
  • Paso 1: Instala el MCP server
  • Paso 2: Configura los ajustes MCP de Cursor
  • Paso 3: Reinicia y verifica
  • Paso 4: Tu primer scrape en Composer
  • Ejemplo completo: crea un rastreador de precios de la competencia
  • Flujo de trabajo: usa los scrapes para escribir código
  • Solución de problemas
  • Preguntas frecuentes

¿Por qué hacer scraping dentro de Cursor?

Cursor Composer trata las MCP tools como acciones de primera clase: elige la herramienta adecuada para cada tarea, pasa argumentos tipados y reincorpora los resultados a la conversación. Cuando haces scraping de sitios web en Cursor IDE a través de CrawlForge, los datos extraídos quedan disponibles de inmediato para que Cursor genere tests, escriba interfaces de TypeScript o actualice dashboards. Sin copiar y pegar, sin cambiar de contexto.

Si ya usas las reglas de Cursor para moldear el comportamiento del Composer, las MCP tools encajan a la perfección: las reglas describen cómo programar, las herramientas exponen qué puede hacer el Composer.

Requisitos previos

  • Cursor IDE 0.42+ -- descárgalo de cursor.com
  • Node.js 18+ -- node --version para comprobarlo
  • Cuenta de CrawlForge -- gratis en crawlforge.dev/signup

Paso 1: Instala el MCP server

Bash

Confirma que está en tu PATH:

Bash

Paso 2: Configura los ajustes MCP de Cursor

Cursor lee los MCP servers desde ~/.cursor/mcp.json. Créalo si no existe:

Bash

Pega esta configuración (reemplaza la clave):

Json

En Windows el archivo está en %USERPROFILE%\.cursor\mcp.json y el comando debería ser crawlforge-mcp-server.cmd.

Paso 3: Reinicia y verifica

  1. Cierra Cursor por completo (Cmd+Q en macOS).
  2. Vuelve a abrir el proyecto.
  3. Ve a Settings -> Features -> MCP. Deberías ver crawlforge con un punto verde y 20 herramientas listadas.

Si el server está en rojo o la lista de herramientas está vacía, salta a Solución de problemas.

Paso 4: Tu primer scrape en Composer

Abre el Composer (Cmd+I) y pega:

Use CrawlForge to fetch https://news.ycombinator.com and list the top 5 story titles.

Cursor llamará a fetch_url (1 credit) y mostrará la respuesta. Cuando apruebes la llamada a la herramienta, el Composer analizará el HTML y devolverá una lista limpia.

Ejemplo completo: crea un rastreador de precios de la competencia

Supongamos que quieres rastrear los cambios de precios en un SaaS de la competencia. Abre el Composer y pega:

Use scrape_structured to pull pricing from https://competitor.example.com/pricing. Fields: plan (h3), price (.price), features (ul li). Then generate a TypeScript type for the response.

Cursor lanza una llamada a scrape_structured con tus selectores, devuelve JSON y emite este TypeScript en el siguiente bloque del editor:

Typescript

Coste total: 2 credits por ejecución. Prográmalo con Vercel Cron o GitHub Actions y tendrás un rastreador de precios dentro del plan gratuito.

Flujo de trabajo: usa los scrapes para escribir código

El verdadero potencial está en alimentar los datos extraídos a la generación de código de Cursor. Patrones probados:

  • Generación de tipos a partir de APIs en vivo: "Fetch https://api.example.com/users, then generate a Zod schema matching the response."
  • Fixtures de tests a partir de páginas reales: "Scrape the top 3 articles from Hacker News and save them as JSON fixtures in tests/fixtures/."
  • Extracción de documentación: "Use extract_content on the React docs for useState, then write an idiomatic example that matches."
  • Paridad de funciones con la competencia: "Use map_site on competitor.com and flag any URL patterns we do not have in our own sitemap."

Cada patrón cuesta de 1 a 5 credits por ejecución y te mantiene dentro de Cursor.

Resumen de costes en credits

OperaciónHerramientaCredits
Obtener HTMLfetch_url1
Texto limpioextract_text1
Artículo legibleextract_content2
Extracción con selectores CSSscrape_structured2
Descubrimiento de sitemapmap_site2
Búsqueda websearch_web5
SPA con clicsscrape_with_actions5
Evasión anti-botstealth_mode5

Solución de problemas

Lista de herramientas vacía en los ajustes de Cursor -- Cursor cachea la configuración MCP. Cierra por completo (Cmd+Q) y vuelve a abrir. Revisa ~/.cursor/logs/ por si hay errores de análisis.

"Command not found: crawlforge-mcp-server" -- El bin global de npm no está en el PATH de Cursor. Soluciónalo poniendo una ruta absoluta en mcp.json: "command": "/usr/local/bin/crawlforge-mcp-server".

Cada llamada devuelve 401 -- Falta la API key o sigue siendo el marcador de posición. Verifícalo con: curl -H "Authorization: Bearer $CRAWLFORGE_API_KEY" https://crawlforge.dev/api/v1/credits/balance.

Cursor pide aprobación en cada llamada a herramienta -- Es el comportamiento por defecto esperado. Activa "Auto-approve for trusted servers" en los ajustes de MCP si quieres que el Composer ejecute los scrapes en silencio.

El Composer ignora la herramienta MCP -- Indícalo de forma explícita: "Use CrawlForge's scrape_structured tool to...". A veces Cursor recurre por defecto a su obtención web integrada, que es menos capaz.

Próximos pasos

  • Lee la guía de reglas de Cursor para optimizar el comportamiento del Composer en el scraping
  • Explora el resumen de las 20 herramientas para ver qué más puedes automatizar
  • Consulta los docs de primeros pasos para la referencia de la API y los precios en credits
  • Compara proveedores en alternativa a Firecrawl

Empieza gratis con 1.000 credits en crawlforge.dev/signup.

Etiquetas

Cursor-IDEweb-scrapingMCPtutorialComposerdeveloper-toolsAI-agents

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Frequently Asked Questions

¿Dónde busca Cursor IDE la configuración del MCP server?+

Cursor lee las configuraciones MCP desde ~/.cursor/mcp.json en macOS y Linux, y desde %USERPROFILE%\\.cursor\\mcp.json en Windows. Los cambios requieren un reinicio completo (Cmd+Q y luego volver a abrir) para que Cursor los detecte.

¿Puede Cursor Composer ejecutar las herramientas de CrawlForge automáticamente?+

Sí. Activa la auto-aprobación para servidores de confianza en Settings > Features > MCP. El Composer llamará entonces a fetch_url, scrape_structured y otras herramientas de CrawlForge sin un diálogo de confirmación por llamada, lo que es ideal para flujos de trabajo iterativos.

¿En qué se diferencia esto de la guía de reglas de Cursor?+

Las reglas de Cursor controlan cómo escribe código el Composer (estilo, frameworks, convenciones de archivos). Las MCP tools como CrawlForge añaden nuevas capacidades: web scraping, extracción estructurada, deep research. Normalmente quieres ambas: reglas para moldear la salida y MCP tools para ampliar lo que el Composer puede hacer.

¿Es compatible Cursor con las MCP tools en el plan gratuito?+

La integración MCP funciona en todos los planes de Cursor, incluido el gratuito. Solo pagas Cursor Pro si necesitas los modelos avanzados. CrawlForge también tiene un plan gratuito (1.000 credits/mes), así que toda la pila puede ejecutarse sin coste para un uso ligero.

¿Puedo usar las MCP tools de Cursor en un monorepo con varios proyectos?+

Sí: la configuración MCP es global para tu perfil de usuario, no por proyecto. Todos los proyectos abiertos en Cursor tienen acceso a las mismas herramientas de CrawlForge. Para anulaciones específicas de un proyecto, añade un .cursor/mcp.json en la raíz del repo y Cursor lo fusiona con la configuración global.

Artículos relacionados

Cómo hacer scraping de sitios web con Claude Code (guía 2026)
Tutorials

Cómo hacer scraping de sitios web con Claude Code (guía 2026)

Haz scraping de cualquier sitio web desde tu terminal con Claude Code y CrawlForge MCP. Obtén páginas, extrae datos y esquiva el anti-bot, en menos de 2 minutos.

C
CrawlForge Team
|
14 abr
|
10m
Cómo hacer scraping de sitios web en Zed AI con CrawlForge MCP
Tutorials

Cómo hacer scraping de sitios web en Zed AI con CrawlForge MCP

Añade web scraping a Zed AI en 3 minutos. Configura CrawlForge MCP en Zed para que tu editor pueda obtener, extraer e investigar datos web en vivo bajo demanda.

C
CrawlForge Team
|
14 abr
|
9m
Cómo hacer scraping de webs con agentes de GitHub Copilot en VS Code
Tutorials

Cómo hacer scraping de webs con agentes de GitHub Copilot en VS Code

Añade web scraping a los agentes de GitHub Copilot en VS Code. Configura CrawlForge MCP para que Copilot pueda obtener, extraer e investigar datos web en vivo bajo demanda.

C
CrawlForge Team
|
14 abr
|
10m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.