Indeed 抓取参数
Web Scraper API Indeed 抓取参数
使用 Thordata 的 Web Scraper API 配置 Indeed 抓取参数,包括公司URL、职位URL,职位列表URL,关键词,地区等参数。
唯一标识:
token ,访问令牌(必填)
此参数用作 API 访问令牌,以确保抓取的合法性。
请求示例:
Authorization: Bearer ********************
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer ********************" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=indeed.com" ^
-d "spider_id=indeed_job-listings_by-keyword" ^
-d "spider_parameters=[{\"country\": \"BR\",\"domain\": \"indeed.com\",\"keyword\": \"analyst\",\"location\": \"New York, NY\",\"date_posted\": \"The past 24 hours\",\"posted_by\": \"Employer\",\"pay\": \"50\",\"location_radius\": \"Exact location only\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"一、产品-抓取公司信息:
1.Indeed -通过公司URL抓取公司信息
spider_id ,所属抓取工具 (必填)
它定义了要使用的抓取工具。
请求示例:
spider_id=indeed_companies-info_by-company-url
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=indeed.com" ^
-d "spider_id=indeed_companies-info_by-company-url" ^
-d "spider_parameters=[{\"company_url\": \"https://www.indeed.com/cmp/Allstate-Insurance\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"
company_url ,公司 URL (必填)
该参数用于指定抓取的公司URL。
请求示例:
"company_url": "https://www.indeed.com/cmp/Allstate-Insurance"
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=indeed.com" ^
-d "spider_id=indeed_companies-info_by-company-url" ^
-d "spider_parameters=[{\"company_url\": \"https://www.indeed.com/cmp/Allstate-Insurance\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"2.Indeed -通过公司列表URL抓取公司信息
spider_id ,所属抓取工具 (必填)
它定义了要使用的抓取工具。
请求示例:
spider_id=indeed_companies-info_by-company-list-url
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=indeed.com" ^
-d "spider_id=indeed_companies-info_by-company-list-url" ^
-d "spider_parameters=[{\"company_list_url\": \"https://www.indeed.com/companies/browse-companies\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"
company_list_url ,公司列表URL (必填)
该参数用于指定抓取的公司列表URL。
请求示例:
"company_list_url": "https://www.indeed.com/companies/browse-companies"
3.Indeed -通过关键词抓取公司信息
4.Indeed -通过行业和地区抓取公司信息
二、产品-抓取职位信息:
1. Indeed -通过职位URL抓取职位信息
job_url, 职位URL(必填)
此参数指定要抓取的职位 URL。
请求示例:
"job_url": "https://fr.indeed.com/viewjob?jk=55b3e5dfa0c2ff66"
2. Indeed -通过关键词抓取职位信息
如果您需要进一步的帮助,请通过电子邮件联系 [email protected]。
Last updated
Was this helpful?