CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
Web scraping desde la CLI: la guía de la CLI de CrawlForge
Tutorials
Volver al blog
Tutoriales

Web scraping desde la CLI: la guía de la CLI de CrawlForge

C
CrawlForge Team
Equipo de Ingeniería
21 de mayo de 2026
10 min de lectura

En esta página

Respuesta rápida

La CLI de CrawlForge es un wrapper para la terminal sobre las 23 herramientas de CrawlForge. Se incluye dentro del paquete crawlforge-mcp-server como el comando `crawlforge`, funciona sin un cliente MCP, produce JSON para pipelines de shell y se instala en 30 segundos con `npm install -g crawlforge-mcp-server`. Úsala para cron jobs, pasos de CI/CD, investigación puntual y cualquier flujo de trabajo donde de otro modo recurrirías a curl más un parser personalizado.

A la mayoría de las herramientas de IA les encanta ser agentes. La CLI de CrawlForge está construida para lo contrario: scriptable, pensada para la terminal, predecible. La instalas, configuras una variable de entorno y cada una de las 23 herramientas de CrawlForge se convierte en un comando de shell. JSON de entrada, JSON de salida. Canalízalo a jq, prográmalo con cron, ejecútalo en CI: funciona igual en todas partes.

Tabla de contenidos

  • ¿Qué es la CLI de CrawlForge?
  • Instálala en 30 segundos
  • Los 15 comandos de un vistazo
  • Tu primer scrape
  • Canalizar la salida JSON a jq
  • Programar con Cron
  • CLI vs MCP vs API directa: cuándo usar cada una
  • Tres flujos de trabajo del mundo real
  • Referencia de flags globales
  • Cuánto cuesta

¿Qué es la CLI de CrawlForge?

La CLI de CrawlForge se incluye dentro del paquete crawlforge-mcp-server como el comando crawlforge y expone las 23 herramientas de CrawlForge como comandos de terminal. Una sola instalación global te da tanto el MCP server como la CLI. No necesita un proceso de larga duración ni un cliente MCP: escribes crawlforge scrape <url>, hace una llamada HTTPS a la API de CrawlForge e imprime JSON en stdout. Esa es toda la historia.

Existe porque la mitad del trabajo de scraping que hace la gente no tiene forma de agente. Cron jobs, pasos de CI, investigación puntual, extracciones ad-hoc desde un shell: esos quieren comandos de toda la vida, no un handshake de JSON-RPC.

Instálala en 30 segundos

Bash

Eso es todo. Sin archivo de configuración, sin flujo de autenticación, sin servicio que iniciar. Si aún no tienes una API key, consigue una en crawlforge.dev/signup: obtienes 1.000 credits gratis al registrarte.

Para hacer la variable de entorno permanente en macOS o Linux:

Bash

En Windows (PowerShell):

Powershell

Los 15 comandos de un vistazo

Cada comando se asigna a una o más herramientas de CrawlForge:

ComandoHerramienta principalCreditsEjemplo
scrapefetch_url, extract_content1-2crawlforge scrape https://example.com
searchsearch_web5crawlforge search "MCP servers 2026"
crawlcrawl_deep4crawlforge crawl https://docs.example.com --depth 3
mapmap_site2crawlforge map https://example.com
extractextract_with_llm3crawlforge extract <url> --schema schema.json
tracktrack_changes3crawlforge track <url> --threshold 10
analyzeanalyze_content3crawlforge analyze <url>
researchdeep_research10crawlforge research "AI agents in 2026"
stealthstealth_mode5crawlforge stealth <url>
batchbatch_scrape5crawlforge batch urls.txt
actionsscrape_with_actions5crawlforge actions <url> --script steps.json
localizelocalization2crawlforge localize <url> --country DE
llmstxtgenerate_llms_txt5crawlforge llmstxt https://example.com
templatescrape_template1crawlforge template amazon-product <url>
monitortrack_changes3crawlforge monitor <url> --interval 3600

Tu primer scrape

La llamada más simple posible:

Bash

Lo que devuelve es el contenido principal de la página en formato JSON:

Json

¿Solo quieres las URLs? Canalízalo a jq:

Bash

¿Lo quieres en un archivo? Redirige stdout:

Bash

Canalizar la salida JSON a jq

Este es el flujo de trabajo que hace que valga la pena instalar la CLI. Todo produce JSON, y el JSON se canaliza a cualquier cosa.

Obtén los títulos de las historias de la portada de HN:

Bash

Busca en la web y extrae las URLs:

Bash

Haz scraping de una página y cuenta las palabras:

Bash

Haz scraping por lotes y luego filtra las respuestas con error:

Bash

El patrón: --json te da salida legible por máquina, y luego jq la corta y la procesa.

Programar con Cron

Una comprobación diaria de la página de precios de un competidor:

Bash

Una ejecución de investigación nocturna:

Bash

Una regeneración semanal de llms.txt para tu propio sitio:

Bash

¿En CI? Usa los mismos comandos en tu YAML de GitHub Actions. La CLI comprueba primero CRAWLFORGE_API_KEY, así que solo configúralo como un secreto del repositorio.

Yaml

CLI vs MCP vs API directa: cuándo usar cada una

Flujo de trabajoUsa la CLIUsa MCPUsa la API directa
Scrape puntual desde tu terminalsínono
Cron job o paso de CIsínosolo si lo necesitas
Agente de Claude / Cursor / Windsurfnosíno
Integrado en un servicio Node/Pythonnosolo si tiene forma de MCPsí
Worker en segundo plano de larga duraciónnonosí
Exploración rápida de un sitio desconocidosíquizásno

Regla general: si un humano está escribiendo el comando, usa la CLI. Si un LLM está seleccionando la herramienta, usa MCP. Si un servidor la está llamando en un bucle, usa la API directa.

Tres flujos de trabajo del mundo real

1. Monitor de precios de la competencia

Un script de shell que se ejecuta a diario, hace scraping de tres páginas de precios de competidores, las compara con la instantánea de ayer y publica en Slack si algo cambió.

Bash

Costo: ~9 credits por día (3 competidores × 3 credits por track).

2. Enriquecimiento de leads desde un CSV

Lee un CSV de dominios de empresas, haz scraping de la página de inicio de cada una en busca de información de contacto y escribe los datos enriquecidos de vuelta.

Bash

Costo: 1 credit por empresa.

3. Pipeline de informe de investigación

Un cron de los domingos por semana que ejecuta una consulta research y envía por correo el resumen sintetizado al equipo.

Bash

Costo: 10 credits por ejecución (research incluye el resumen sintetizado).

Referencia de flags globales

Estos funcionan en cada comando:

  • --json -- JSON compacto y legible por máquina (apto para canalizar)
  • --pretty -- JSON con formato legible
  • --quiet -- suprime toda la salida de stdout (solo código de salida)
  • --api-key <key> -- anula la variable de entorno CRAWLFORGE_API_KEY
  • --timeout <ms> -- anula el timeout predeterminado de 30s

Para escribir los resultados en un archivo, redirige stdout: crawlforge scrape <url> --pretty > out.json.

Cuánto cuesta

La CLI en sí es gratis. Solo pagas por las llamadas a las herramientas subyacentes, facturadas contra tu saldo de credits existente. Sin suscripción extra, sin tarifa por invocación. Un cron diario que ejecuta track contra tres URLs y research una vez por semana cuesta aproximadamente 100 credits al mes, bien dentro del plan gratuito.


¿Listo para instalarla? Consigue tu API key gratis en crawlforge.dev/signup y ejecuta npm install -g crawlforge-mcp-server. ¿Nuevo por aquí? Lee el anuncio de lanzamiento de la v4.2.2 para conocer todo lo nuevo, o el quickstart original de MCP para la versión MCP en su lugar.

Etiquetas

CLIweb-scrapingtutorialterminalautomationscripting

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Frequently Asked Questions

¿Es gratis la CLI de CrawlForge?+

El paquete de la CLI en sí es gratuito y abierto. Solo pagas por las llamadas a las herramientas subyacentes, facturadas contra tu saldo normal de credits de CrawlForge, igual que harías desde MCP o la API directa. No hay tarifa extra por invocación.

¿Necesito una API key de CrawlForge para usar la CLI?+

Sí. La CLI lee la variable de entorno CRAWLFORGE_API_KEY en cada llamada. Consigue una clave gratis en crawlforge.dev/signup (sin tarjeta de crédito) y configúrala una vez en el perfil de tu shell.

¿Puedo usar la CLI de CrawlForge en pipelines de CI/CD?+

Sí, este es uno de sus casos de uso principales. Instala con "npm install -g crawlforge-mcp-server" en tu runner de CI, configura CRAWLFORGE_API_KEY como un secreto del repositorio y ejecuta cualquier comando. Funciona igual en GitHub Actions, GitLab CI, CircleCI y Jenkins.

¿En qué se diferencia la CLI de CrawlForge de curl?+

curl te da HTML en bruto. La CLI de CrawlForge devuelve JSON estructurado: contenido limpio, metadatos extraídos, enlaces, encabezados y campos específicos de cada herramienta como resultados de búsqueda, resúmenes de investigación o datos de producto extraídos con plantillas. También maneja defensas anti-bot, modo stealth y automatización de navegador, todo lo que curl no puede hacer.

¿La CLI admite las 23 herramientas de CrawlForge?+

Sí. Los 15 comandos cubren las 23 herramientas (algunos comandos exponen varias herramientas mediante flags). Por ejemplo, "crawlforge extract" se asigna a extract_with_llm por defecto y a extract_structured con el flag --css.

¿Puede la CLI de CrawlForge producir datos estructurados para parsear?+

Sí, pasa --json en cualquier comando y la salida es JSON limpio apto para canalizar a jq o cualquier herramienta compatible con JSON. Usa --pretty para un formato legible por humanos, o redirige stdout a un archivo (crawlforge scrape <url> --pretty > out.json).

Artículos relacionados

Cómo usar CrawlForge con Make y Zapier
Tutorials

Cómo usar CrawlForge con Make y Zapier

Conecta CrawlForge a Make (Integromat) y Zapier para automatizar el web scraping. Configuración sin código con módulos HTTP, webhooks y ejemplos de flujos de trabajo.

C
CrawlForge Team
|
23 abr
|
8m
Cómo hacer scraping de sitios web con Claude Code (guía 2026)
Tutorials

Cómo hacer scraping de sitios web con Claude Code (guía 2026)

Haz scraping de cualquier sitio web desde tu terminal con Claude Code y CrawlForge MCP. Obtén páginas, extrae datos y esquiva el anti-bot, en menos de 2 minutos.

C
CrawlForge Team
|
14 abr
|
10m
Cómo usar CrawlForge con agentes de LangGraph
Tutorials

Cómo usar CrawlForge con agentes de LangGraph

Construye agentes de web scraping con estado usando LangGraph y CrawlForge. Guía en TypeScript que cubre nodos del grafo, gestión de estado y flujos de scraping condicionales.

C
CrawlForge Team
|
24 abr
|
8m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.