CrawlForge
Alat Berstruktur2 credits

scrape_structured

Ekstrak data berstruktur daripada mana-mana halaman web menggunakan pemilih CSS tersuai. Sesuai untuk scraping produk e-dagang, pengagregatan berita dan apa-apa keperluan pengekstrakan data tersuai.

Kes Penggunaan

Scraping Produk E-Dagang

Ekstrak tajuk produk, harga, penerangan dan imej daripada kedai dalam talian

Pengekstrakan Artikel Berita

Ekstrak tajuk utama, penulis, tarikh dan kandungan daripada tapak berita

Transformasi Data Tersuai

Petakan mana-mana struktur HTML kepada skema JSON yang anda kehendaki

Penyenaraian Hartanah

Ekstrak butiran hartanah, harga dan imej daripada tapak penyenaraian

Endpoint

POST/api/v1/tools/scrape_structured
Auth Required
2 req/s pada pelan Free
2 credits

Parameters

NameTypeRequiredDefaultDescription
url
stringRequired-
URL untuk scrape
Example: https://example.com/product
selectors
objectRequired-
Pemilih CSS yang memetakan nama medan kepada pemilih
Example: {"title": "h1.product-title", "price": ".price", "description": ".product-desc"}

Pemilih CSS:

Gunakan mana-mana sintaks pemilih CSS yang sah. Corak biasa:

  • .className - Pilih mengikut kelas
  • #id - Pilih mengikut ID
  • tag.class - Gabungkan tag dan kelas
  • .parent > .child - Anak langsung
  • [data-id="value"] - Pemilih atribut

Contoh Permintaan

cURL - E-Commerce Product

terminalBash

TypeScript - News Article

scrapeStructured.tsTypescript

Python - Real Estate Listing

scrape_structured.pyPython

Contoh Respons

200 OK320ms
{
"success": true,
"data": {
"title": "Premium Wireless Headphones",
"price": "299.99",
"currency": "USD",
"description": "High-quality wireless headphones with active noise cancellation and 30-hour battery life.",
"image": "https://example.com/images/headphones.jpg",
"rating": "4.7",
"availability": "In Stock"
},
"credits_used": 2,
"credits_remaining": 998,
"processing_time": 320
}
Field Descriptions
data.titleDiekstrak daripada pemilih h1.product-title
data.priceDiekstrak daripada pemilih .price-value
data.descriptionDiekstrak daripada pemilih .product-description
credits_usedCredits ditolak untuk permintaan ini (2 setiap scrape)

Kos Credit

2 credits
2 credits setiap permintaan
Setiap scrape berstruktur berkos 2 credits, tanpa mengira bilangan pemilih.

Petua: Untuk scraping berbilang halaman dengan struktur yang sama, gunakan batch_scrape untuk kecekapan yang lebih baik.

Alat Berkaitan

batch_scrape
Scrape berbilang URL secara serentak (5 credits)
structured_extract
Pengekstrakan berbantukan AI tanpa pemilih (3 credits)
Bersedia untuk mengekstrak data berstruktur? Daftar percuma dan dapatkan 1,000 credits.