CrawlForge
Herramienta avanzada5 credits

batch_scrape

Haga scraping de varias URL en paralelo con gestión de trabajos asíncronos, notificaciones por webhook y concurrencia configurable. Ideal para la recopilación masiva de datos y los flujos de trabajo automatizados.

Casos de uso

Recopilación masiva de datos

Haga scraping de catálogos de productos, artículos de noticias o trabajos de investigación en varias páginas simultáneamente

Análisis de la competencia

Monitoree precios, funciones y contenido en los sitios web de la competencia en un solo lote

Flujos de trabajo automatizados

Integre webhooks para procesar en tiempo real a medida que se completan los trabajos de scraping

Informes programados

Genere informes diarios haciendo scraping por lotes de paneles, analíticas o páginas de estado

Archivado de contenido

Archive varias páginas como screenshots o PDF para fines de cumplimiento o registros históricos

Procesamiento en paralelo

Controle los niveles de concurrencia para optimizar la velocidad respetando los límites de tasa

Endpoint

POST/api/v1/tools/batch_scrape
Auth Required
2 req/s en el plan Free
5 credits

Parameters

NameTypeRequiredDefaultDescription
urls
string[]Required-
Arreglo de URL para hacer scraping (1-50 URL)
Example: ["https://example.com", "https://example.org"]
formats
string[]Optional["markdown"]
Formatos de salida para cada URL: markdown, html, text, screenshot o pdf
Example: ["markdown", "screenshot"]
webhook
stringOptional-
URL del webhook que recibirá la notificación de finalización del trabajo
Example: https://yourapp.com/webhook/scrape-complete
maxConcurrency
numberOptional5
Cantidad máxima de solicitudes concurrentes (1-10)
Example: 10
timeout
numberOptional30000
Tiempo de espera por URL en milisegundos
Example: 45000
onlyMainContent
booleanOptionalfalse
Extraer únicamente el contenido principal, eliminando el contenido repetitivo
Example: true

Payload del webhook

Cuando el lote se complete, la URL de su webhook recibirá:

webhook-payload.jsonJson

Ejemplos de solicitud

terminalBash

Ejemplo de respuesta

200 OK156ms
{
"success": true,
"data": {
"jobId": "batch_1234567890abcdef",
"status": "processing",
"totalUrls": 3,
"completed": 0,
"successful": 0,
"failed": 0,
"startedAt": "2025-10-01T12:00:00Z",
"estimatedCompletionAt": "2025-10-01T12:02:00Z",
"results": []
},
"credits_used": 5,
"credits_remaining": 995,
"processing_time": 156
}
Field Descriptions
data.jobIdIdentificador único para hacer seguimiento de este trabajo por lotes
data.statusEstado del trabajo: queued, processing, completed o failed
data.totalUrlsCantidad total de URL en el lote
data.completedCantidad de URL procesadas (exitosas + fallidas)
data.estimatedCompletionAtTiempo estimado de finalización según la concurrencia
credits_used5 credits por solicitud de lote (tarifa plana)
credits_remainingSu saldo de credits restante

Manejo de errores

Demasiadas URL (400 Bad Request)

Máximo 50 URL por lote. Divida los lotes grandes en varias solicitudes.

URL de webhook no válida (400 Bad Request)

El webhook debe ser una URL HTTPS válida. Por seguridad, no se admiten webhooks HTTP.

Credits insuficientes (402 Payment Required)

El lote requiere 5 credits por adelantado por cada llamada. Agregue más credits antes de reintentar.

Trabajo no encontrado (404 Not Found)

El ID del trabajo no existe o ha expirado. Los trabajos se conservan durante 7 días tras su finalización.

Consejo profesional: Use webhooks para lotes grandes en lugar de sondeo. Esto reduce las llamadas a la API y mejora la fiabilidad. Las URL fallidas no consumen credits: solo se cobran los scrapes exitosos.

Costo en credits

5 credits
5 credits por solicitud
Tarifa plana por solicitud de lote. Procese hasta 50 URL por lote con ejecución en paralelo y notificaciones por webhook.

Qué incluye:

Hasta 50 URL por lote

Procesamiento en paralelo con concurrencia configurable

Múltiples formatos de salida (markdown, HTML, text, screenshot, PDF)

Notificaciones por webhook al finalizar

Gestión de trabajos asíncronos

Recomendaciones por plan:

Plan Free: 1,000 credits de prueba por única vez = 200 solicitudes por lote

Plan Hobby: 5,000 credits = 1,000 solicitudes por lote ($19/mo)

Plan Professional: 50,000 credits = 10,000 solicitudes por lote ($99/mo)

Herramientas relacionadas

crawl_deep
Descubra primero las URL y luego hágales scraping por lotes (4 credits)
deep_research
Investigación en varias etapas a través de múltiples fuentes (10 credits)
screenshot
Capture instantáneas visuales por lotes (2 credits por screenshot)
stealth_mode
Evada la detección de bots en sitios protegidos (5 credits)
¿Listo para probar batch_scrape? Regístrese gratis y obtenga 1,000 credits para empezar a crear.