Teknik Scraping Lanjutan
Kuasai senario scraping kompleks termasuk kandungan dinamik, halaman yang dilindungi pengesahan, pemaparan JavaScript, dan pengendalian AJAX dengan CrawlForge MCP.
1. Kandungan Dinamik & JavaScript
Banyak tapak web moden memaparkan kandungan dengan JavaScript selepas muatan halaman awal. Gunakan scrape_with_actions untuk menunggu elemen dinamik.
fetch_url sebaliknya (5x lebih murah)Contoh: Scraping SPA React
5 credits
fetch_url dahulu. Banyak SPA memaparkan kandungan terlebih dahulu dalam HTML awal atau mendedahkan titik akhir API yang boleh anda panggil terus.2. Pengesahan & Sesi
Scrape halaman di sebalik borang log masuk atau pengesahan API menggunakan kuki, pengepala, atau penghantaran borang automatik.
Strategi 1: Pengesahan Kuki
Terbaik untuk tapak yang membolehkan anda memperoleh kuki sesi secara manual
Strategi 2: Log Masuk Automatik dengan Borang
Automasikan keseluruhan proses log masuk dengan form_submit
3. AJAX & Tatal Tak Terhingga
Tangkap kandungan yang dimuatkan semasa anda menatal atau mengklik butang "Load More".
Contoh Tatal Tak Terhingga
5 credits
4. Pengendalian Had Kadar
Laksanakan backoff eksponen dan logik cuba semula apabila menghadapi respons 429.