CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
Extrae datos web con LLMs locales (Ollama + CrawlForge)
AI Engineering
Volver al blog
Ingeniería de IA

Extrae datos web con LLMs locales (Ollama + CrawlForge)

C
CrawlForge Team
Equipo de Ingeniería
24 de mayo de 2026
9 min de lectura

En esta página

Respuesta rápida

extract_with_llm es una herramienta de CrawlForge que ejecuta extracción web impulsada por LLM contra una instancia local de Ollama por defecto, con la opción de recurrir a OpenAI o Anthropic. No se requiere ninguna API key externa, tus datos extraídos nunca salen de tu máquina y el coste de LLM por extracción baja de céntimos a cero. Cuesta 3 credits de CrawlForge por llamada, sin importar el modelo.

Una tarea de extracción web no debería requerir enviar tus datos extraídos a OpenAI. Con extract_with_llm y una instalación local de Ollama, la extracción estructurada ahora se ejecuta por completo en tu máquina -- sin API key, sin coste por token, sin que un tercero vea tu contenido. Esta publicación es el análisis a fondo: por qué importa lo local, cómo configurarlo y cuándo usarlo frente a las alternativas.

Tabla de contenidos

  • ¿Qué es la extracción web con LLM?
  • ¿Por qué Ollama local (y no OpenAI)?
  • Configuración: Ollama + extract_with_llm en 5 minutos
  • list_ollama_models: descubre qué hay en tu máquina
  • Extracción basada en esquemas
  • Cuándo usar Ollama vs OpenAI vs Anthropic
  • Comparación de costes
  • Limitaciones y precisión

¿Qué es la extracción web con LLM?

La extracción web con LLM es el flujo de trabajo en el que le entregas al modelo dos cosas -- el HTML en bruto de una página y un esquema que describe lo que quieres -- y el modelo devuelve JSON estructurado. Es el reemplazo moderno de los selectores CSS escritos a mano. Cuando cambia el diseño de un sitio, los selectores se rompen; el LLM se adapta.

CrawlForge lleva tiempo ofreciendo esto como extract_structured (primero CSS, con LLM de respaldo). La nueva herramienta extract_with_llm es LLM-first: cada extracción es una llamada al LLM. Lo que cambió en la v4.2.2 es el proveedor por defecto. Antes necesitabas una API key de OpenAI o Anthropic. Ahora no.

¿Por qué Ollama local (y no OpenAI)?

Tres razones, en orden descendente de importancia para la mayoría de los equipos.

1. Tus datos extraídos se quedan en tu máquina. Cuando llamas a OpenAI, el contenido de la página va a OpenAI. Para inteligencia competitiva, documentos legales, datos de clientes o cualquier cosa regulada, eso suele ser un impedimento absoluto. Ollama local significa solo localhost.

2. El LLM es gratis. Una llamada a gpt-4o-mini cuesta alrededor de $0.0001 por extracción a escala. Suena a nada -- hasta que estás ejecutando 10.000 extracciones al día. Ollama cuesta $0 más electricidad. Sigues pagando 3 credits de CrawlForge por llamada, sin importar el proveedor.

3. No hay una nueva API key que gestionar. Si tienes Ollama, tienes un proveedor. Sin registro, sin alertas de facturación, sin rotación.

El compromiso es la calidad del modelo. Un llama3.1:8b en una laptop no igualará a gpt-4o en páginas difíciles. Para el 80% de los casos (HTML limpio, esquema simple), va bien. Para el 20% (muy formateado, ambiguo), puedes recurrir a OpenAI o Anthropic en la misma llamada.

Configuración: Ollama + extract_with_llm en 5 minutos

Bash

Eso es del lado de Ollama. Ahora desde CrawlForge (vía la CLI, el MCP server o la API -- cualquier vía funciona):

Typescript

Desde la CLI:

Bash

list_ollama_models: descubre qué hay en tu máquina

Antes de ejecutar un lote grande, comprueba qué hay realmente instalado:

Bash

O vía MCP/SDK:

Typescript

Esto cuesta 0 credits. Es un ayudante de descubrimiento, no una llamada de extracción. Útil en flujos de onboarding, pruebas de humo de CI ("¿está Ollama bien configurado?") y como primer paso en cualquier pipeline de LLM local.

Extracción basada en esquemas

El esquema es un objeto JSON Schema estándar. El LLM lo lee y produce una salida que coincide. Dos patrones funcionan bien:

Patrón 1: esquema plano para datos simples

Typescript

Patrón 2: esquema anidado para datos más ricos

Typescript

Cuanto más pequeño sea el esquema, más fiable será la extracción -- especialmente en modelos locales de 8B. Si encuentras que un modelo alucina campos, simplifica.

Cuándo usar Ollama vs OpenAI vs Anthropic

EscenarioProveedor recomendadoPor qué
Extracción por lotes de alto volumenOllamaCoste marginal del LLM = $0
Datos sensibles o reguladosOllamaSolo localhost
Razonamiento complejo de varias páginasOpenAI (gpt-4o)El mejor razonamiento en páginas difíciles
Contexto largo (50K+ tokens)Anthropic (Claude)Ventana de contexto de 200K
Prototipo rápido, bajo volumenOllamaCero configuración más allá de la instalación
Contenido ambiguo (sarcasmo, jerga)OpenAI o AnthropicModelo más grande = mejor desambiguación

La buena noticia: cambiar de proveedor es un solo cambio de parámetro. Puedes prototipar con Ollama, toparte con una página difícil, cambiar a provider: "openai" para esa única llamada y continuar.

Comparación de costes

Coste por cada 1.000 extracciones, asumiendo una página promedio (~3K tokens de entrada, ~200 tokens de salida):

ProveedorModeloCoste de LLM por 1KCredits de CrawlForge por 1KTotal por 1K
Ollama (local)llama3.1:8b$0 (electricidad)3.000 credits3.000 credits
Ollama (local)llama3.1:70b$0 (electricidad, más)3.000 credits3.000 credits
OpenAIgpt-4o-mini~$0.453.000 credits3.000 credits + $0.45
OpenAIgpt-4o~$8.503.000 credits3.000 credits + $8.50
Anthropicclaude-haiku-4-5~$0.303.000 credits3.000 credits + $0.30
Anthropicclaude-sonnet-4-6~$4.503.000 credits3.000 credits + $4.50

Los credits de CrawlForge son fijos entre proveedores -- pagas por la orquestación, no por el modelo. En nuestro plan Hobby (10.000 credits/$19/mes), eso son aproximadamente 3.300 extracciones con LLM al mes por $19 + $0 (si usas Ollama).

Limitaciones y precisión

Lo que Ollama local (llama3.1:8b) hace bien en nuestros benchmarks internos:

  • Páginas de producto limpias (Amazon, Shopify): ~95% de precisión en los campos
  • Metadatos de artículos (Substack, Medium): ~92%
  • Hilos de foros (HN, Reddit): ~88%

Con lo que tiene dificultades:

  • Páginas con mucho renderizado JS y HTML mínimo (usa scrape_with_actions primero, luego extrae)
  • Páginas con estructura ambigua (usa un modelo de frontera)
  • Esquemas con 20+ campos (divídelos en varias extracciones)
  • Contenido que no esté en inglés (usa un modelo multilingüe como mistral)

Si la precisión es crítica y Ollama omite campos, la solución suele ser: un esquema más simple, o subir a provider: "openai" para esa llamada.


¿Listo para extraer datos sin que salgan de tu máquina? Empieza gratis con 1.000 credits y prueba extract_with_llm con tu Ollama local. ¿Nuevo en CrawlForge? Lee el anuncio de lanzamiento de la v4.2.2 para tener contexto, o la guía de la CLI para un flujo de trabajo centrado en la terminal.

Etiquetas

extract-with-llmOllamalocal-AIai-engineeringstructured-extractionprivacy

Sobre el autor

C

CrawlForge Team

Equipo de Ingeniería

Construimos el MCP server de web scraping más completo. Creamos herramientas que ayudan a los desarrolladores a extraer, analizar y transformar datos web para aplicaciones de IA.

En esta página

Frequently Asked Questions

¿extract_with_llm cuesta credits si Ollama es gratis?+

Sí -- 3 credits de CrawlForge por llamada, sin importar qué proveedor de LLM uses. El credit cubre la orquestación: obtener la página, manejar las defensas anti-bot, validar la respuesta contra tu esquema y devolver JSON estructurado. El coste del LLM en sí es aparte: $0 con Ollama, o precio por token con OpenAI/Anthropic.

¿Qué modelos de Ollama funcionan mejor para extracción web?+

llama3.1:8b es el punto de partida recomendado -- rápido, lo bastante preciso para la mayoría de las páginas y se ejecuta en hardware de consumo (8GB de RAM como mínimo). Para mayor precisión en páginas complejas, prueba llama3.1:70b (requiere 48GB de RAM). Para extracción multilingüe, mistral o qwen2.5 funcionan bien. Evita modelos por debajo de 7B de parámetros -- alucinan campos.

¿Puedo usar una instancia remota de Ollama en lugar de localhost?+

Sí. Configura la variable de entorno OLLAMA_HOST con la URL de tu Ollama remoto antes de llamar a extract_with_llm. Esto es útil si ejecutas Ollama en un servidor GPU dedicado y tu worker de CrawlForge está en otra máquina. La conexión sigue siendo directa -- CrawlForge no la enruta como proxy.

¿Cómo se compara extract_with_llm con extract_structured?+

extract_structured es CSS-first: tú proporcionas los selectores, devuelve los datos coincidentes y solo recurre a un LLM si los selectores fallan. extract_with_llm es LLM-first: cada extracción es una llamada al modelo. Usa extract_structured cuando conoces los selectores y son estables; usa extract_with_llm cuando el diseño de la página es desconocido o cambia a menudo.

¿Se envían mis datos a algún sitio cuando uso Ollama?+

Ningún tercero ve tus datos cuando el proveedor es "ollama". El HTML extraído va de CrawlForge a tu instancia de Ollama (localhost o tu propio servidor) y la respuesta vuelve. Nada se registra ni se almacena de nuestro lado más allá de los metadatos estándar de la petición. Con el proveedor "openai" o "anthropic", el HTML se envía a ese proveedor bajo sus respectivos términos.

¿Qué pasa si la página tiene protección anti-bot?+

Usa stealth_mode primero para obtener la página y luego pasa el HTML directamente a extract_with_llm vía su parámetro "html" (omite el paso de obtención). O combínalo en una sola llamada: extract_with_llm con stealth: true hace que la obtención use proxies residenciales y rotación de fingerprint, y luego ejecuta la extracción con LLM sobre el resultado.

Artículos relacionados

El protocolo MCP explicado: una guía para desarrolladores en 2026
AI Engineering

El protocolo MCP explicado: una guía para desarrolladores en 2026

Aprende cómo funciona el Model Context Protocol, por qué importa para los agentes de IA y cómo construir MCP servers y clientes con diagramas de arquitectura y código.

C
CrawlForge Team
|
27 abr
|
10m
Cómo crear un pipeline de RAG con datos web
AI Engineering

Cómo crear un pipeline de RAG con datos web

Crea un pipeline de RAG en producción que rastrea sitios web, extrae contenido, divide el texto en fragmentos, genera embeddings y sirve respuestas con generación aumentada por recuperación.

C
CrawlForge Team
|
14 abr
|
11m
Scraping en modo sigiloso: cómo CrawlForge evade la detección anti-bot
AI Engineering

Scraping en modo sigiloso: cómo CrawlForge evade la detección anti-bot

Análisis técnico en profundidad de los sistemas de detección anti-bot y de cómo las funciones de modo sigiloso de CrawlForge te ayudan a hacer scraping de sitios web protegidos de forma ética y eficaz.

C
CrawlForge Team
|
22 ene
|
14m

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.