extract_structured
Berikan pengekstrak satu JSON Schema dan gesaan bahasa semula jadi. LLM membaca halaman dan mengembalikan data yang sepadan dengan skema anda. Apabila tiada penyedia LLM dikonfigurasi, ia beralih ke pengekstrakan pemilih CSS menggunakan petunjuk anda.
Kes Penggunaan
Pengekstrakan Produk Skema-Dahulu
Takrifkan medan yang anda mahu sekali; LLM memetakan mana-mana tapak e-dagang ke skema anda.
Penghuraian Resume & Dokumen
Ekstrak nama calon, kemahiran dan sejarah kerja terus ke dalam objek bertaip.
Penyemaian Graf Pengetahuan
Ekstrak entiti dan perhubungan daripada artikel ke dalam JSON berstruktur untuk pemuat graf.
Endpoint
/api/v1/tools/extract_structuredParameters
llmConfig untuk menggunakan pengekstrakan dikuasakan LLM. Tanpanya, alat menggunakan selectorHints untuk pengekstrakan CSS berketentuan — lebih murah dan tiada kunci LLM diperlukan.| Name | Type | Required | Default | Description |
|---|---|---|---|---|
url | string | Required | - | URL untuk mengekstrak data Example: https://example.com/product/123 |
schema | object | Required | - | JSON Schema yang menerangkan data untuk diekstrak Example: {"type":"object","properties":{"title":{"type":"string"},"price":{"type":"number"}},"required":["title"]} |
prompt | string | Optional | - | Arahan bahasa semula jadi yang membimbing pengekstrakan LLM Example: Extract the product name, current price, and whether it is in stock |
llmConfig | object | Optional | - | Konfigurasi penyedia LLM pilihan (provider, apiKey). Tinggalkan untuk menggunakan sandaran pemilih CSS. Example: {"provider": "openai", "apiKey": "sk-..."} |
selectorHints | object | Optional | - | Petunjuk pemilih CSS untuk membimbing pengekstrakan (juga digunakan oleh sandaran pemilih) Example: {"title": "h1.product-title", "price": ".price"} |
fallbackToSelectors | boolean | Optional | true | Beralih ke pengekstrakan pemilih CSS apabila LLM tidak tersedia Example: true |
Contoh Permintaan
cURL — LLM extraction
TypeScript — selector fallback
Python
Contoh Respons
{ "success": true, "data": { "url": "https://example.com/product/123", "extracted": { "title": "Premium Wireless Headphones", "price": 299.99, "in_stock": true }, "extraction_method": "llm", "schema_fields": 3, "required_fields": 2, "llm_provider": "openai", "confidence": 0.92 }, "credits_used": 3, "credits_remaining": 997, "processing_time": 1240}data.extractedSepadan dengan JSON Schema yang anda berikandata.extraction_method"llm" apabila penyedia dikonfigurasi, "selector_fallback" sebaliknyadata.confidenceKeyakinan pengekstrak (keyakinan LLM atau kadar padanan pemilih)credits_used3 credits rata setiap panggilanKos Credit
Tip: Gandingkan dengan scrape_structured (2 credits, CSS sahaja) apabila anda sudah mempunyai pemilih yang stabil dan tidak memerlukan fleksibiliti LLM.