¿Qué hay de nuevo en CrawlForge v4.2.2?

v4.2.2 añade tres herramientas (extract_with_llm, list_ollama_models, scrape_template) y una CLI independiente que se incluye dentro del paquete crawlforge-mcp-server como el comando `crawlforge`. El número de herramientas pasa de 20 a 23. La CLI es completamente nueva y se ejecuta sin cliente MCP, así que puedes usar CrawlForge desde cualquier terminal, cron job o pipeline de CI.

¿Necesito la CLI de CrawlForge si ya uso MCP?

No. MCP sigue siendo lo más adecuado para agentes de IA (Claude, Cursor, Windsurf, etc.). La CLI existe para la otra mitad del trabajo de scraping -- cron jobs, pasos de CI, extracciones puntuales desde tu terminal -- donde un handshake de MCP es excesivo y solo quieres JSON en stdout que se canalice hacia jq.

¿extract_with_llm requiere una API key de OpenAI o Anthropic?

No. Por defecto usa Ollama local, que se ejecuta enteramente en tu máquina sin necesidad de ninguna API key externa. OpenAI y Anthropic son compatibles como proveedores opcionales si quieres modelos de frontera, pero el camino por defecto es totalmente local.

¿Qué sitios admite scrape_template?

Diez sitios en v4.2.2: Amazon, LinkedIn, GitHub, YouTube, Reddit, Hacker News, Stack Overflow, npm, Product Hunt y Twitter/X. Cada uno cuesta 1 credit por scrape y devuelve JSON estructurado específico del sitio sin necesidad de selectores CSS.

¿Cómo actualizo a v4.2.2?

Los usuarios existentes no tienen que hacer nada -- las nuevas herramientas están disponibles en todos los planes y aparecen automáticamente en tu cliente MCP. Para instalar la nueva CLI, ejecuta "npm install -g crawlforge-mcp-server" y define la variable de entorno CRAWLFORGE_API_KEY.

CrawlForge v4.2.2: nueva CLI + 3 herramientas para scraping con IA local

Hoy lanzamos CrawlForge v4.2.2, nuestra mayor versión desde el lanzamiento. Trae tres herramientas nuevas, una interfaz de línea de comandos independiente y un cambio silencioso en cómo pensamos sobre el web scraping para IA: la mayor parte debería ejecutarse localmente, en tu propia máquina, sin API keys.

Este artículo es el paraguas de todo lo que hay en 4.2.2. En los próximos nueve días le siguen tres guías en profundidad.

Tabla de contenidos

Qué incluye esta versión
La nueva CLI de CrawlForge
Extract With LLM: extracción con IA local
Scrape Template: diez sitios, una llamada
list_ollama_models: descubrimiento de modelos
Flujo antiguo vs flujo de v4.2.2
Costes de credits
Cómo actualizar
Qué viene a continuación

Qué incluye esta versión

v4.2.2 añade cuatro cosas:

La CLI crawlforge -- una herramienta de línea de comandos independiente, incluida en el paquete crawlforge-mcp-server, que expone las 26 herramientas de CrawlForge a tu terminal. No requiere cliente MCP.
extract_with_llm -- extracción estructurada con LLM que por defecto usa Ollama local. No necesita ninguna API key externa.
scrape_template -- scrapers preconstruidos para Amazon, LinkedIn, GitHub, YouTube, Reddit, Hacker News, Stack Overflow, npm, Product Hunt y Twitter/X.
list_ollama_models -- una herramienta de descubrimiento que lista los modelos de tu instancia local de Ollama.

El número de herramientas pasa de 20 a 23. La CLI es completamente nueva -- no es una herramienta, es un canal de distribución.

La nueva CLI de CrawlForge

La CLI es el camino más corto desde la intención hasta los datos extraídos. La instalas una vez, defines una variable de entorno y cada herramienta de CrawlForge se convierte en un comando:

Bash

npm install -g crawlforge-mcp-server
export CRAWLFORGE_API_KEY="cf_live_your_key_here"

crawlforge scrape https://example.com
crawlforge search "best MCP servers 2026"
crawlforge research "AI agent frameworks" --depth deep

¿Por qué importa esto? Porque MCP es excelente para agentes de IA, pero mucho del trabajo de scraping no es una tarea de un agente de IA. Es un cron job. Un paso de CI. Una extracción puntual desde tu terminal. Para eso quieres JSON en stdout que se canalice hacia jq, no un handshake de JSON-RPC.

Lee la guía completa de la CLI de CrawlForge para la referencia completa de comandos y flujos de trabajo del mundo real.

Extract With LLM: extracción con IA local

extract_with_llm es extracción estructurada impulsada por un modelo de lenguaje. Le pasas una URL y un esquema, y te devuelve JSON. La novedad es que por defecto usa Ollama local en lugar de llamar a OpenAI o Anthropic.

Typescript

// Pull structured data with a local model. No API key needed.
{
  "url": "https://news.ycombinator.com/item?id=123456",
  "schema": {
    "type": "object",
    "properties": {
      "title": { "type": "string" },
      "points": { "type": "number" },
      "comments": { "type": "number" }
    }
  },
  "provider": "ollama",
  "model": "llama3.1:8b"
}

Del valor por defecto local-first se derivan tres cosas:

Sin costes de API de terceros. El LLM es gratis. Solo pagas 3 credits de CrawlForge por extracción.
Sin datos que salgan de tu máquina. El contenido extraído se queda en localhost.
Sin ninguna API key nueva que gestionar. Si Ollama está instalado, ya está.

OpenAI y Anthropic siguen siendo compatibles vía provider: "openai" o provider: "anthropic" para casos en los que quieras un modelo de frontera. Guía detallada: extrae datos con LLM locales.

Scrape Template: diez sitios, una llamada

scrape_template es para la larga cola de solicitudes de scraping que se parecen todas: "consígueme datos de productos de Amazon", "consígueme los metadatos de un repo de GitHub", "consígueme las publicaciones más populares de Hacker News de hoy". No deberías tener que escribir selectores CSS para esto. Lo hicimos una vez, lo mantenemos, tú lo llamas.

Bash

crawlforge template amazon-product "https://www.amazon.com/dp/B0CHX1W1XY"
crawlforge template github-repo "https://github.com/anthropics/anthropic-sdk-python"
crawlforge template hacker-news-front-page "https://news.ycombinator.com"

Diez plantillas se incluyen en esta versión:

Plantilla	Qué devuelve	Credits
`amazon-product`	Título, precio, valoración, reseñas e imágenes del producto	1
`linkedin-profile`	Nombre del perfil, titular, ubicación y resumen	1
`github-repo`	Metadatos del repo, estrellas, lenguaje y temas	1
`youtube-video`	Título del vídeo, visualizaciones, canal y descripción	1
`reddit-thread`	Título de la publicación, puntuación, autor y cuerpo	1
`hacker-news-front-page`	Títulos de la portada, puntos, URLs y comentarios	1
`stackoverflow-question`	Pregunta, respuestas, aceptada y recuento de votos	1
`npm-package`	Metadatos del paquete, descargas semanales y versión	1
`producthunt-launch`	Nombre del producto, lema, upvotes y temas	1
`tweet`	Texto del tweet, autor, URL e imagen	1

Recorrido completo con código: haz scraping de Amazon, LinkedIn y GitHub con una sola herramienta.

list_ollama_models: descubrimiento de modelos

Es más útil como comprobación rápida antes de ejecutar extract_with_llm. Lista cada modelo de tu instancia local de Ollama con nombre, tamaño y fecha de modificación.

Bash

crawlforge extract --list-ollama-models

Cuesta 1 credit. No hace scraping, ni llama a ningún LLM -- solo consulta la API local de Ollama en 127.0.0.1:11434 y devuelve el resultado. Si alguna vez te has preguntado qué modelo tienes realmente instalado, esta es la respuesta.

Flujo antiguo vs flujo de v4.2.2

Tarea	Antes de 4.2.2	v4.2.2
Hacer scraping desde tu terminal	curl + parser personalizado, o arrancar un REPL de Node	`crawlforge scrape <url>`
Extraer datos estructurados con un LLM	`extract_structured` (selectores CSS) o hacerlo a mano con Puppeteer + OpenAI	`extract_with_llm` (Ollama por defecto)
Hacer scraping de Amazon, LinkedIn, GitHub	`scrape_structured` con selectores mantenidos a mano	`scrape_template` (mantenemos los selectores)
Ejecutar scraping en CI/cron	curl con la API key en las cabeceras	`crawlforge <cmd>` con variable de entorno

Costes de credits

Las tres herramientas nuevas siguen nuestro modelo de coste de credits existente. Sin sorpresas:

Herramienta	Credits	Por qué
`list_ollama_models`	1	Asistente de descubrimiento
`scrape_template`	1	Una sola página, esquema preconstruido
`extract_with_llm`	3	Inferencia de LLM (agnóstica del proveedor)

La CLI en sí es gratis. Usa tu API key existente y factura contra tu saldo de credits habitual.

Cómo actualizar

Los usuarios existentes no tienen que hacer nada. Las nuevas herramientas están disponibles en todos los planes -- Free, Hobby, Professional y Business -- y aparecen automáticamente en tu cliente MCP.

Si quieres la CLI:

Bash

npm install -g crawlforge-mcp-server
export CRAWLFORGE_API_KEY="cf_live_..."
crawlforge --help

Si quieres probar la extracción con Ollama:

Bash

# 1. Install Ollama (one-time)
curl -fsSL https://ollama.com/install.sh | sh

# 2. Pull a model (llama3.1:8b is a good start)
ollama pull llama3.1:8b

# 3. Run extraction through CrawlForge
crawlforge extract https://example.com --provider ollama --model llama3.1:8b

Qué viene a continuación

Estamos trabajando en tres cosas para la 4.3:

Más plantillas -- Etsy, eBay, TikTok, Instagram, Google Maps. Envíanos tus peticiones en Discord.
Entrega por webhook para batch_scrape -- recibe los resultados enviados a tu endpoint cuando terminen los trabajos de larga duración.
Modo watch en la CLI -- crawlforge track --watch para diffs en vivo de las páginas monitorizadas.

¿Listo para probar las nuevas herramientas? Empieza gratis con 1.000 credits -- sin tarjeta de crédito. O ve directo a las guías en profundidad: la guía de la CLI, extracción con LLM local y las diez plantillas de scraping.

Este artículo es el paraguas de todo lo que hay en 4.2.2. En los próximos nueve días le siguen tres guías en profundidad.

Tabla de contenidos

Qué incluye esta versión
La nueva CLI de CrawlForge
Extract With LLM: extracción con IA local
Scrape Template: diez sitios, una llamada
list_ollama_models: descubrimiento de modelos
Flujo antiguo vs flujo de v4.2.2
Costes de credits
Cómo actualizar
Qué viene a continuación

Qué incluye esta versión

v4.2.2 añade cuatro cosas:

La CLI crawlforge -- una herramienta de línea de comandos independiente, incluida en el paquete crawlforge-mcp-server, que expone las 26 herramientas de CrawlForge a tu terminal. No requiere cliente MCP.
extract_with_llm -- extracción estructurada con LLM que por defecto usa Ollama local. No necesita ninguna API key externa.
scrape_template -- scrapers preconstruidos para Amazon, LinkedIn, GitHub, YouTube, Reddit, Hacker News, Stack Overflow, npm, Product Hunt y Twitter/X.
list_ollama_models -- una herramienta de descubrimiento que lista los modelos de tu instancia local de Ollama.

El número de herramientas pasa de 20 a 23. La CLI es completamente nueva -- no es una herramienta, es un canal de distribución.

La nueva CLI de CrawlForge

La CLI es el camino más corto desde la intención hasta los datos extraídos. La instalas una vez, defines una variable de entorno y cada herramienta de CrawlForge se convierte en un comando:

Bash

npm install -g crawlforge-mcp-server
export CRAWLFORGE_API_KEY="cf_live_your_key_here"

crawlforge scrape https://example.com
crawlforge search "best MCP servers 2026"
crawlforge research "AI agent frameworks" --depth deep

Lee la guía completa de la CLI de CrawlForge para la referencia completa de comandos y flujos de trabajo del mundo real.

Extract With LLM: extracción con IA local

Typescript

// Pull structured data with a local model. No API key needed.
{
  "url": "https://news.ycombinator.com/item?id=123456",
  "schema": {
    "type": "object",
    "properties": {
      "title": { "type": "string" },
      "points": { "type": "number" },
      "comments": { "type": "number" }
    }
  },
  "provider": "ollama",
  "model": "llama3.1:8b"
}

Del valor por defecto local-first se derivan tres cosas:

Sin costes de API de terceros. El LLM es gratis. Solo pagas 3 credits de CrawlForge por extracción.
Sin datos que salgan de tu máquina. El contenido extraído se queda en localhost.
Sin ninguna API key nueva que gestionar. Si Ollama está instalado, ya está.

OpenAI y Anthropic siguen siendo compatibles vía provider: "openai" o provider: "anthropic" para casos en los que quieras un modelo de frontera. Guía detallada: extrae datos con LLM locales.

Scrape Template: diez sitios, una llamada

Bash

crawlforge template amazon-product "https://www.amazon.com/dp/B0CHX1W1XY"
crawlforge template github-repo "https://github.com/anthropics/anthropic-sdk-python"
crawlforge template hacker-news-front-page "https://news.ycombinator.com"

Diez plantillas se incluyen en esta versión:

Plantilla	Qué devuelve	Credits
`amazon-product`	Título, precio, valoración, reseñas e imágenes del producto	1
`linkedin-profile`	Nombre del perfil, titular, ubicación y resumen	1
`github-repo`	Metadatos del repo, estrellas, lenguaje y temas	1
`youtube-video`	Título del vídeo, visualizaciones, canal y descripción	1
`reddit-thread`	Título de la publicación, puntuación, autor y cuerpo	1
`hacker-news-front-page`	Títulos de la portada, puntos, URLs y comentarios	1
`stackoverflow-question`	Pregunta, respuestas, aceptada y recuento de votos	1
`npm-package`	Metadatos del paquete, descargas semanales y versión	1
`producthunt-launch`	Nombre del producto, lema, upvotes y temas	1
`tweet`	Texto del tweet, autor, URL e imagen	1

Recorrido completo con código: haz scraping de Amazon, LinkedIn y GitHub con una sola herramienta.

list_ollama_models: descubrimiento de modelos

Es más útil como comprobación rápida antes de ejecutar extract_with_llm. Lista cada modelo de tu instancia local de Ollama con nombre, tamaño y fecha de modificación.

Bash

crawlforge extract --list-ollama-models

Flujo antiguo vs flujo de v4.2.2

Tarea	Antes de 4.2.2	v4.2.2
Hacer scraping desde tu terminal	curl + parser personalizado, o arrancar un REPL de Node	`crawlforge scrape <url>`
Extraer datos estructurados con un LLM	`extract_structured` (selectores CSS) o hacerlo a mano con Puppeteer + OpenAI	`extract_with_llm` (Ollama por defecto)
Hacer scraping de Amazon, LinkedIn, GitHub	`scrape_structured` con selectores mantenidos a mano	`scrape_template` (mantenemos los selectores)
Ejecutar scraping en CI/cron	curl con la API key en las cabeceras	`crawlforge <cmd>` con variable de entorno

Costes de credits

Las tres herramientas nuevas siguen nuestro modelo de coste de credits existente. Sin sorpresas:

Herramienta	Credits	Por qué
`list_ollama_models`	1	Asistente de descubrimiento
`scrape_template`	1	Una sola página, esquema preconstruido
`extract_with_llm`	3	Inferencia de LLM (agnóstica del proveedor)

La CLI en sí es gratis. Usa tu API key existente y factura contra tu saldo de credits habitual.

Cómo actualizar

Si quieres la CLI:

Bash

npm install -g crawlforge-mcp-server
export CRAWLFORGE_API_KEY="cf_live_..."
crawlforge --help

Si quieres probar la extracción con Ollama:

Bash

# 1. Install Ollama (one-time)
curl -fsSL https://ollama.com/install.sh | sh

# 2. Pull a model (llama3.1:8b is a good start)
ollama pull llama3.1:8b

# 3. Run extraction through CrawlForge
crawlforge extract https://example.com --provider ollama --model llama3.1:8b

Qué viene a continuación

Estamos trabajando en tres cosas para la 4.3:

Más plantillas -- Etsy, eBay, TikTok, Instagram, Google Maps. Envíanos tus peticiones en Discord.
Entrega por webhook para batch_scrape -- recibe los resultados enviados a tu endpoint cuando terminen los trabajos de larga duración.
Modo watch en la CLI -- crawlforge track --watch para diffs en vivo de las páginas monitorizadas.

En esta página

Tabla de contenidos

Qué incluye esta versión

La nueva CLI de CrawlForge

Extract With LLM: extracción con IA local

Scrape Template: diez sitios, una llamada

list_ollama_models: descubrimiento de modelos

Flujo antiguo vs flujo de v4.2.2

Costes de credits

Cómo actualizar

Qué viene a continuación

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Frequently Asked Questions

Artículos relacionados

CrawlForge v4.8.0: Claude Skills que se autoactivan

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA

18 herramientas de web scraping en un MCP server: la guía completa de CrawlForge

En esta página

Tabla de contenidos

Qué incluye esta versión

La nueva CLI de CrawlForge

Extract With LLM: extracción con IA local

Scrape Template: diez sitios, una llamada

list_ollama_models: descubrimiento de modelos

Flujo antiguo vs flujo de v4.2.2

Costes de credits

Cómo actualizar

Qué viene a continuación

Pruébalo tú mismo — sin necesidad de registrarte

Etiquetas

Sobre el autor

CrawlForge Team

Mantente al día con los últimos artículos

Frequently Asked Questions

Artículos relacionados

CrawlForge v4.8.0: Claude Skills que se autoactivan

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA

18 herramientas de web scraping en un MCP server: la guía completa de CrawlForge