入门指南

了解如何使用 Web Scraper API 构建器或者以编程方式运行抓取工具。

请注意,使用我们的Web Scraper API时,您需要拥有一个Thordata账户。如果您还没有账户,请先完成注册。如果您已经了解如何使用,可以直接前往仪表板登录并使用。

  1. 选择您的第一个抓取工具

登录 Thordata 仪表盘后,导航至 Web Scraper 商店。 要获取您的第一个抓取文件,您必须从 Web Scraper商店选择一个现有的抓取器。 在本文中,我们将以“Amazon - 通过URL收集产品信息”作为示例。选择好抓取器后,您可以通过多种方式启动它。

  1. 了解您的第一个抓取工具

选择您的第一个抓取器后,您将被引导到一个新页面。在这个页面上,您可以查看有关该抓取器的多个详细信息,包括介绍、示例JSON/CSV输出、示例输出中字段的解释,以及运行该抓取器所需的输入参数说明。 此外,如果抓取器未包含您需要的字段,您可以通过缺失数据点处的反馈入口或页面底部的反馈区提供意见。我们将在24小时内与您联系,帮助解决问题。

  1. 使用您的第一个抓取工具 ①通过 API 构建器抓取: 将您想要抓取的亚马逊产品详情链接替换到API构建器中的“URLs”位置,然后点击“开始抓取”。

②通过编程方式抓取: 通过使用右侧的代码发送POST请求来调用抓取工具。例如:

curl -X POST "https://scraperapi.thordata.com/builder" \
  -H "Authorization: Bearer Token-ID" \
  -H "Content-Type: application/x-www-form-urlencoded" \
  -d "spider_name=amazon.com" \
  -d "spider_id=amazon_product_by-url" \
  -d "spider_parameters=[{\"url\": \"https://www.amazon.com/HISDERN-Checkered-Handkerchief-Classic-Necktie/dp/B0BRXPR726\",\"zip_code\": \"94107\"}]" \
  -d "spider_errors=true" \
  -d "file_name={{TasksID}}"

  1. 获取结果与历史抓取记录 网页抓取器可能需要一些时间来完成操作,请耐心等待。 您很快就会看到您创建的第一个任务成功完成。您可以通过“任务”列表中的下载按钮以多种格式导出数据。当然,如果在抓取完成后直接关闭了抓取页面,但仍然希望查看历史抓取内容,您可以通过抓取器的“任务”列表查看所有历史抓取记录。

如果您需要进一步的帮助,请通过电子邮件联系 [email protected]

Last updated

Was this helpful?