scrape_structured
Ekstrak data berstruktur daripada mana-mana halaman web menggunakan pemilih CSS tersuai. Sesuai untuk scraping produk e-dagang, pengagregatan berita dan apa-apa keperluan pengekstrakan data tersuai.
Kes Penggunaan
Scraping Produk E-Dagang
Ekstrak tajuk produk, harga, penerangan dan imej daripada kedai dalam talian
Pengekstrakan Artikel Berita
Ekstrak tajuk utama, penulis, tarikh dan kandungan daripada tapak berita
Transformasi Data Tersuai
Petakan mana-mana struktur HTML kepada skema JSON yang anda kehendaki
Penyenaraian Hartanah
Ekstrak butiran hartanah, harga dan imej daripada tapak penyenaraian
Endpoint
/api/v1/tools/scrape_structuredParameters
| Name | Type | Required | Default | Description |
|---|---|---|---|---|
url | string | Required | - | URL untuk scrape Example: https://example.com/product |
selectors | object | Required | - | Pemilih CSS yang memetakan nama medan kepada pemilih Example: {"title": "h1.product-title", "price": ".price", "description": ".product-desc"} |
Pemilih CSS:
Gunakan mana-mana sintaks pemilih CSS yang sah. Corak biasa:
.className- Pilih mengikut kelas#id- Pilih mengikut IDtag.class- Gabungkan tag dan kelas.parent > .child- Anak langsung[data-id="value"]- Pemilih atribut
Contoh Permintaan
cURL - E-Commerce Product
TypeScript - News Article
Python - Real Estate Listing
Contoh Respons
{ "success": true, "data": { "title": "Premium Wireless Headphones", "price": "299.99", "currency": "USD", "description": "High-quality wireless headphones with active noise cancellation and 30-hour battery life.", "image": "https://example.com/images/headphones.jpg", "rating": "4.7", "availability": "In Stock" }, "credits_used": 2, "credits_remaining": 998, "processing_time": 320}data.titleDiekstrak daripada pemilih h1.product-titledata.priceDiekstrak daripada pemilih .price-valuedata.descriptionDiekstrak daripada pemilih .product-descriptioncredits_usedCredits ditolak untuk permintaan ini (2 setiap scrape)Kos Credit
Petua: Untuk scraping berbilang halaman dengan struktur yang sama, gunakan batch_scrape untuk kecekapan yang lebih baik.