CrawlForge
Alat AI3 credits

extract_structured

Berikan pengekstrak satu JSON Schema dan gesaan bahasa semula jadi. LLM membaca halaman dan mengembalikan data yang sepadan dengan skema anda. Apabila tiada penyedia LLM dikonfigurasi, ia beralih ke pengekstrakan pemilih CSS menggunakan petunjuk anda.

Kes Penggunaan

Pengekstrakan Produk Skema-Dahulu

Takrifkan medan yang anda mahu sekali; LLM memetakan mana-mana tapak e-dagang ke skema anda.

Penghuraian Resume & Dokumen

Ekstrak nama calon, kemahiran dan sejarah kerja terus ke dalam objek bertaip.

Penyemaian Graf Pengetahuan

Ekstrak entiti dan perhubungan daripada artikel ke dalam JSON berstruktur untuk pemuat graf.

Endpoint

POST/api/v1/tools/extract_structured
Auth Required
2 req/s pada pelan Free
3 credits

Parameters

LLM lwn. sandaran pemilih: Berikan llmConfig untuk menggunakan pengekstrakan dikuasakan LLM. Tanpanya, alat menggunakan selectorHints untuk pengekstrakan CSS berketentuan — lebih murah dan tiada kunci LLM diperlukan.
NameTypeRequiredDefaultDescription
url
stringRequired-
URL untuk mengekstrak data
Example: https://example.com/product/123
schema
objectRequired-
JSON Schema yang menerangkan data untuk diekstrak
Example: {"type":"object","properties":{"title":{"type":"string"},"price":{"type":"number"}},"required":["title"]}
prompt
stringOptional-
Arahan bahasa semula jadi yang membimbing pengekstrakan LLM
Example: Extract the product name, current price, and whether it is in stock
llmConfig
objectOptional-
Konfigurasi penyedia LLM pilihan (provider, apiKey). Tinggalkan untuk menggunakan sandaran pemilih CSS.
Example: {"provider": "openai", "apiKey": "sk-..."}
selectorHints
objectOptional-
Petunjuk pemilih CSS untuk membimbing pengekstrakan (juga digunakan oleh sandaran pemilih)
Example: {"title": "h1.product-title", "price": ".price"}
fallbackToSelectors
booleanOptionaltrue
Beralih ke pengekstrakan pemilih CSS apabila LLM tidak tersedia
Example: true

Contoh Permintaan

cURL — LLM extraction

terminalBash

TypeScript — selector fallback

extractStructured.tsTypescript

Python

extract_structured.pyPython

Contoh Respons

200 OK1.2s
{
"success": true,
"data": {
"url": "https://example.com/product/123",
"extracted": {
"title": "Premium Wireless Headphones",
"price": 299.99,
"in_stock": true
},
"extraction_method": "llm",
"schema_fields": 3,
"required_fields": 2,
"llm_provider": "openai",
"confidence": 0.92
},
"credits_used": 3,
"credits_remaining": 997,
"processing_time": 1240
}
Field Descriptions
data.extractedSepadan dengan JSON Schema yang anda berikan
data.extraction_method"llm" apabila penyedia dikonfigurasi, "selector_fallback" sebaliknya
data.confidenceKeyakinan pengekstrak (keyakinan LLM atau kadar padanan pemilih)
credits_used3 credits rata setiap panggilan

Kos Credit

3 credits
3 credits setiap permintaan
3 credits rata sama ada panggilan menggunakan LLM atau sandaran pemilih.

Tip: Gandingkan dengan scrape_structured (2 credits, CSS sahaja) apabila anda sudah mempunyai pemilih yang stabil dan tidak memerlukan fleksibiliti LLM.

Alat Berkaitan

scrape_structured
Pengekstrakan pemilih CSS (2 credits)
analyze_content
Analisis sentimen, entiti dan topik (3 credits)
Bersedia untuk mengekstrak data berstruktur bertaip? Daftar secara percuma dan dapatkan 1,000 credits.