CrawlForge
InicioCasos de usoIntegracionesPreciosDocumentaciónBlog
  1. Inicio
  2. /
  3. Plantillas
  4. /
  5. Recolector de datos de entrenamiento de IA
IA y LLMIntermedio

Recolector de datos de entrenamiento de IA

Recopila y limpia conjuntos de datos web a gran escala para el fine-tuning y el entrenamiento de modelos de IA.

Configuración de MCP

{
  "tools": [
    {
      "name": "batch_scrape",
      "params": {
        "urls": [
          "https://docs.example.com/page-1",
          "https://docs.example.com/page-2"
        ],
        "format": "markdown"
      }
    },
    {
      "name": "extract_content",
      "params": {
        "format": "text",
        "remove_navigation": true
      }
    }
  ]
}

Cómo funciona

1
batch_scrape
5 credits
2
extract_content
2 credits

Total estimado: ~7 créditos por ejecución

Etiquetas

AItraining-datamachine-learningdatasets

¿Listo para usar esta plantilla?

Cada cuenta nueva recibe 1,000 créditos gratis. No se requiere tarjeta de crédito.

Empieza gratis con 1,000 créditos

Plantillas relacionadas

IA y LLMIntermedio
Base de conocimiento de documentación
Rastrea sitios de documentación y construye una base de conocimiento estructurada para la búsqueda impulsada por IA.
crawl_deep (4 cr)extract_content (2 cr)summarize_content (4 cr)

Pie de página

CrawlForge

Web scraping empresarial para agentes de IA. 23 herramientas MCP especializadas diseñadas para desarrolladores modernos que crean sistemas inteligentes.

Producto

  • Funciones
  • Precios
  • Casos de uso
  • Integraciones
  • Alternativas
  • Registro de cambios

Recursos

  • Primeros pasos
  • Referencia de la API
  • Plantillas
  • Guías
  • Blog
  • Glosario
  • Preguntas frecuentes
  • Mapa del sitio

Desarrolladores

  • Protocolo MCP
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

Empresa

  • Acerca de
  • Contacto
  • Privacidad
  • Términos

Mantente al día

Recibe las últimas novedades sobre nuevas herramientas y funciones.

Creado con Next.js y el protocolo MCP

© 2025-2026 CrawlForge. Todos los derechos reservados.