入门指南

了解如何使用 Web Scraper API 构建器或者以编程方式运行抓取工具。

需要注意的是,当您想要使用我们的 Web Scraper API 时,您需要拥有一个 Thordata 的账户。如果您没有,请先完成注册。如果您已了解清楚如何使用,就可以前往仪表盘进行登录使用了。

  1. 选择您的第一个抓取工具

登录 Thordata 仪表盘后,导航至 Web Scraper 商店。 要想获得您的第一份抓取文件,您必须从 Web Scraper 商店选择一个现有的抓取工具。 我们将选择“ Amazon - 通过 URL 收集产品信息 ” 作为本文的示例。选择抓取工具后,您可以通过多种方式启动它。

  1. 了解您的第一个抓取工具

选择您的第一个抓取工具后,您将会进入一个新的页面,在该页面中,您可以看到该抓取工具的一些介绍、输出的 JSON 示例/ CSV 示例、输出示例字段的说明以及该抓取工具抓取时需要输入参数说明等。 另外,如果您想要的字段该抓取工具未包含,您可以通过缺少数据点处或者底部反馈入口进行反馈,我们将在24小时内与您联系并帮您解决。

  1. 使用您的第一个抓取工具 ①通过 API 构建器抓取: 将 API 构建器中的 “ URLs ” 更换为您想要抓取的 Amazon 产品详情链接,然后点击“ 开始抓取 ”即可。

②通过编程方式抓取: 通过右侧的代码发送 POST 请求来调用抓取工具,例如:

curl --request POST --url https://scraperapi.thordata.com/builder?product_id=amazon_product_by-url --header "Authorization: Bearer Token-ID" --header "content-type: application/json" --data "{\"spider_info\":{\"spider_parameters\":[{\"url\":\"https://www.amazon.com/LAURA-GELLER-NEW-YORK-Retractable/dp/B086H4VCBJ\"}],\"spider_id\":\"amazon_product_by-url\",\"spider_errors\":true},\"spider_name\":\"amazon.com\"}"
  1. 获取结果与历史抓取记录 Web Scraper 抓取工具可能需要等待一段时间才能运行完成,请耐心等待。 就这样,您很快就会等到创建的第一个任务的成功。您可以通过" 任务 "列表的下载按钮进行多种格式导出数据。 当然,如果您抓取完成直接关闭了抓取页面,但是还想要查看抓取的历史内容,您就可以通过该抓取工具的“任务”列表查看所有抓取的历史记录。

如果您需要更多帮助,请通过邮箱[email protected]联系我们。

Last updated

Was this helpful?