入門指南

了解如何使用 Web Scraper API 建構器或以程式化方式執行抓取工具。 請注意,使用我們的 Web Scraper API 時,您需要擁有一個 Thordata 帳戶。如果您還沒有帳戶,請先完成註冊。如果您已經了解如何使用,可以直接前往儀表板登入並使用。

  1. 選擇您的第一個抓取工具 登入 Thordata 儀表板後,導航至 Web Scraper 商店。 要獲取您的第一個抓取文件,您必須從 Web Scraper 商店選擇一個現有的抓取器。 在本文中,我們將以[Amazon - 透過 URL 收集產品信息]作為示例。選擇好抓取器後,您可以通過多種方式啟動它。

  1. 了解您的第一個抓取工具 選擇您的第一個抓取器後,您將被引導到一個新頁面。在這個頁面上,您可以查看該抓取器的多個詳細信息,包括介紹、示例 JSON/CSV 輸出、示例輸出中字段的解釋,以及運行該抓取器所需的輸入參數說明。 此外,如果抓取器未包含您需要的字段,您可以通過缺失數據點處的反饋入口或頁面底部的反饋區提供意見。我們將在 24 小時內與您聯繫,幫助解決問題。

  1. 使用您的第一個抓取工具 ① 透過 API 建構器進行抓取: 將您想要抓取的亞馬遜產品詳細鏈接替換到 API 建構器中的「URLs」位置,然後點擊「開始抓取」。

② 透過程式化方式進行抓取: 通過使用右側的代碼發送 POST 請求來調用抓取工具。例如:

curl -X POST "https://scraperapi.thordata.com/builder" \
  -H "Authorization: Bearer Token-ID" \
  -H "Content-Type: application/x-www-form-urlencoded" \
  -d "spider_name=amazon.com" \
  -d "spider_id=amazon_product_by-url" \
  -d "spider_parameters=[{\"url\": \"https://www.amazon.com/HISDERN-Checkered-Handkerchief-Classic-Necktie/dp/B0BRXPR726\",\"zip_code\": \"94107\"}]" \
  -d "spider_errors=true" \
  -d "file_name={{TasksID}}"

  1. 獲取結果與歷史抓取記錄 網頁抓取器可能需要一些時間來完成操作,請耐心等待。 您很快就會看到您創建的第一個任務成功完成。您可以通過「任務」列表中的下載按鈕以多種格式導出數據。當然,如果在抓取完成後直接關閉了抓取頁面,但仍然希望查看歷史抓取內容,您可以通過抓取器的「任務」列表查看所有歷史抓取記錄。

如果您需要進一步的幫助,請通過電子郵件聯繫 [email protected]

Last updated

Was this helpful?