CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
CrawlForge v4.2.2: nueva CLI + 3 herramientas para scraping con IA local
Product Updates
Volver al blog
Novedades del producto

CrawlForge v4.2.2: nueva CLI + 3 herramientas para scraping con IA local

C
CrawlForge Team
Equipo de Ingeniería
18 de mayo de 2026
6 min de lectura

En esta página

Respuesta rápida

CrawlForge v4.2.2 incluye una CLI independiente (empaquetada en el paquete crawlforge-mcp-server) y tres nuevas herramientas: extract_with_llm para extracción con IA local vía Ollama, list_ollama_models para descubrir modelos gratis y scrape_template para hacer scraping de una línea en 10 sitios populares. La CLI se ejecuta donde sea que corra npm y no necesita un cliente MCP. Instálala con `npm install -g crawlforge-mcp-server`.

Hoy lanzamos CrawlForge v4.2.2, nuestra mayor versión desde el lanzamiento. Trae tres herramientas nuevas, una interfaz de línea de comandos independiente y un cambio silencioso en cómo pensamos sobre el web scraping para IA: la mayor parte debería ejecutarse localmente, en tu propia máquina, sin API keys.

Este artículo es el paraguas de todo lo que hay en 4.2.2. En los próximos nueve días le siguen tres guías en profundidad.

Tabla de contenidos

  • Qué incluye esta versión
  • La nueva CLI de CrawlForge
  • Extract With LLM: extracción con IA local
  • Scrape Template: diez sitios, una llamada
  • list_ollama_models: descubrimiento de modelos gratis
  • Flujo antiguo vs flujo de v4.2.2
  • Costes de credits
  • Cómo actualizar
  • Qué viene a continuación

Qué incluye esta versión

v4.2.2 añade cuatro cosas:

  1. La CLI crawlforge -- una herramienta de línea de comandos independiente, incluida en el paquete crawlforge-mcp-server, que expone las 23 herramientas de CrawlForge a tu terminal. No requiere cliente MCP.
  2. extract_with_llm -- extracción estructurada con LLM que por defecto usa Ollama local. No necesita ninguna API key externa.
  3. scrape_template -- scrapers preconstruidos para Amazon, LinkedIn, GitHub, YouTube, Reddit, Hacker News, Stack Overflow, npm, Product Hunt y Twitter/X.
  4. list_ollama_models -- una herramienta de descubrimiento gratuita que lista los modelos de tu instancia local de Ollama.

El número de herramientas pasa de 20 a 23. La CLI es completamente nueva -- no es una herramienta, es un canal de distribución.

La nueva CLI de CrawlForge

La CLI es el camino más corto desde la intención hasta los datos extraídos. La instalas una vez, defines una variable de entorno y cada herramienta de CrawlForge se convierte en un comando:

Bash

¿Por qué importa esto? Porque MCP es excelente para agentes de IA, pero mucho del trabajo de scraping no es una tarea de un agente de IA. Es un cron job. Un paso de CI. Una extracción puntual desde tu terminal. Para eso quieres JSON en stdout que se canalice hacia jq, no un handshake de JSON-RPC.

Lee la guía completa de la CLI de CrawlForge para la referencia completa de comandos y flujos de trabajo del mundo real.

Extract With LLM: extracción con IA local

extract_with_llm es extracción estructurada impulsada por un modelo de lenguaje. Le pasas una URL y un esquema, y te devuelve JSON. La novedad es que por defecto usa Ollama local en lugar de llamar a OpenAI o Anthropic.

Typescript

Del valor por defecto local-first se derivan tres cosas:

  • Sin costes de API de terceros. El LLM es gratis. Solo pagas 3 credits de CrawlForge por extracción.
  • Sin datos que salgan de tu máquina. El contenido extraído se queda en localhost.
  • Sin ninguna API key nueva que gestionar. Si Ollama está instalado, ya está.

OpenAI y Anthropic siguen siendo compatibles vía provider: "openai" o provider: "anthropic" para casos en los que quieras un modelo de frontera. Guía detallada: extrae datos con LLM locales.

Scrape Template: diez sitios, una llamada

scrape_template es para la larga cola de solicitudes de scraping que se parecen todas: "consígueme datos de productos de Amazon", "consígueme los metadatos de un repo de GitHub", "consígueme las publicaciones más populares de Hacker News de hoy". No deberías tener que escribir selectores CSS para esto. Lo hicimos una vez, lo mantenemos, tú lo llamas.

Bash

Diez plantillas se incluyen en esta versión:

PlantillaQué devuelveCredits
amazon-productTítulo, precio, valoración, reseñas e imágenes del producto1
linkedin-profileNombre del perfil, titular, ubicación y resumen1
github-repoMetadatos del repo, estrellas, lenguaje y temas1
youtube-videoTítulo del vídeo, visualizaciones, canal y descripción1
reddit-threadTítulo de la publicación, puntuación, autor y cuerpo1
hacker-news-front-pageTítulos de la portada, puntos, URLs y comentarios1
stackoverflow-questionPregunta, respuestas, aceptada y recuento de votos1
npm-packageMetadatos del paquete, descargas semanales y versión1
producthunt-launchNombre del producto, lema, upvotes y temas1
tweetTexto del tweet, autor, URL e imagen1

Recorrido completo con código: haz scraping de Amazon, LinkedIn y GitHub con una sola herramienta.

list_ollama_models: descubrimiento de modelos gratis

Es más útil como comprobación rápida antes de ejecutar extract_with_llm. Lista cada modelo de tu instancia local de Ollama con nombre, tamaño y fecha de modificación.

Bash

Cuesta cero credits. No hace scraping, ni llama a ningún LLM -- solo consulta la API local de Ollama en 127.0.0.1:11434 y devuelve el resultado. Si alguna vez te has preguntado qué modelo tienes realmente instalado, esta es la respuesta.

Flujo antiguo vs flujo de v4.2.2

TareaAntes de 4.2.2v4.2.2
Hacer scraping desde tu terminalcurl + parser personalizado, o arrancar un REPL de Nodecrawlforge scrape <url>
Extraer datos estructurados con un LLMextract_structured (selectores CSS) o hacerlo a mano con Puppeteer + OpenAIextract_with_llm (Ollama por defecto)
Hacer scraping de Amazon, LinkedIn, GitHubscrape_structured con selectores mantenidos a manoscrape_template (mantenemos los selectores)
Ejecutar scraping en CI/croncurl con la API key en las cabecerascrawlforge <cmd> con variable de entorno

Costes de credits

Las tres herramientas nuevas siguen nuestro modelo de coste de credits existente. Sin sorpresas:

HerramientaCreditsPor qué
list_ollama_models0Asistente de descubrimiento gratuito
scrape_template1Una sola página, esquema preconstruido
extract_with_llm3Inferencia de LLM (agnóstica del proveedor)

La CLI en sí es gratis. Usa tu API key existente y factura contra tu saldo de credits habitual.

Cómo actualizar

Los usuarios existentes no tienen que hacer nada. Las nuevas herramientas están disponibles en todos los planes -- Free, Hobby, Professional y Business -- y aparecen automáticamente en tu cliente MCP.

Si quieres la CLI:

Bash

Si quieres probar la extracción con Ollama:

Bash

Qué viene a continuación

Estamos trabajando en tres cosas para la 4.3:

  • Más plantillas -- Etsy, eBay, TikTok, Instagram, Google Maps. Envíanos tus peticiones en Discord.
  • Entrega por webhook para batch_scrape -- recibe los resultados enviados a tu endpoint cuando terminen los trabajos de larga duración.
  • Modo watch en la CLI -- crawlforge track --watch para diffs en vivo de las páginas monitorizadas.

¿Listo para probar las nuevas herramientas? Empieza gratis con 1.000 credits -- sin tarjeta de crédito. O ve directo a las guías en profundidad: la guía de la CLI, extracción con LLM local y las diez plantillas de scraping.

Etiquetas

releasev4.2.2CLIOllamaannouncementMCP

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Frequently Asked Questions

¿Qué hay de nuevo en CrawlForge v4.2.2?+

v4.2.2 añade tres herramientas (extract_with_llm, list_ollama_models, scrape_template) y una CLI independiente que se incluye dentro del paquete crawlforge-mcp-server como el comando `crawlforge`. El número de herramientas pasa de 20 a 23. La CLI es completamente nueva y se ejecuta sin cliente MCP, así que puedes usar CrawlForge desde cualquier terminal, cron job o pipeline de CI.

¿Necesito la CLI de CrawlForge si ya uso MCP?+

No. MCP sigue siendo lo más adecuado para agentes de IA (Claude, Cursor, Windsurf, etc.). La CLI existe para la otra mitad del trabajo de scraping -- cron jobs, pasos de CI, extracciones puntuales desde tu terminal -- donde un handshake de MCP es excesivo y solo quieres JSON en stdout que se canalice hacia jq.

¿extract_with_llm requiere una API key de OpenAI o Anthropic?+

No. Por defecto usa Ollama local, que se ejecuta enteramente en tu máquina sin necesidad de ninguna API key externa. OpenAI y Anthropic son compatibles como proveedores opcionales si quieres modelos de frontera, pero el camino por defecto es totalmente local.

¿Qué sitios admite scrape_template?+

Diez sitios en v4.2.2: Amazon, LinkedIn, GitHub, YouTube, Reddit, Hacker News, Stack Overflow, npm, Product Hunt y Twitter/X. Cada uno cuesta 1 credit por scrape y devuelve JSON estructurado específico del sitio sin necesidad de selectores CSS.

¿Cómo actualizo a v4.2.2?+

Los usuarios existentes no tienen que hacer nada -- las nuevas herramientas están disponibles en todos los planes y aparecen automáticamente en tu cliente MCP. Para instalar la nueva CLI, ejecuta "npm install -g crawlforge-mcp-server" y define la variable de entorno CRAWLFORGE_API_KEY.

Artículos relacionados

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA
Product Updates

CrawlForge MCP ya está disponible: web scraping gratis para agentes de IA

CrawlForge MCP se lanza hoy con 20 herramientas de web scraping, integración MCP para Claude y Cursor, y un plan gratuito con 1.000 credits. Construye agentes más rápido.

C
CrawlForge Team
|
31 mar
|
6m
18 herramientas de web scraping en un MCP server: la guía completa de CrawlForge
Product Updates

18 herramientas de web scraping en un MCP server: la guía completa de CrawlForge

Descubre las 20 herramientas de web scraping en CrawlForge MCP, desde la obtención básica de URLs hasta la investigación impulsada por IA. Una referencia completa para desarrolladores de agentes de IA.

C
CrawlForge Team
|
7 ene
|
10m
Bienvenido a CrawlForge: web scraping empresarial para IA
Product Updates

Bienvenido a CrawlForge: web scraping empresarial para IA

Te presentamos CrawlForge MCP, un conjunto de 20 herramientas API de web scraping especializadas para apps de IA modernas que hace que la extracción de datos web sea simple y escalable.

C
CrawlForge Team
|
20 dic
|
3m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.