Instagram 抓取参数
Web Scraper API Instagram 抓取参数
使用 Thordata 的 Web Scraper API 配置 Instagram 抓取参数,包括个人资料 URL、最大帖子数量、开始日期、结束日期、帖子类型、帖子 URL 、用户名、抓取评论数量、是否抓取最新评论、是否抓取回复、抓取 Reel 最大数量等参数。
唯一标识:
token ,访问令牌(必填)
此参数用作 API 访问令牌,以确保抓取请求的合法性。
示例请求:
Bearer ********************************
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer ********************************" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=instagram.com" ^
-d "spider_id=ins_posts_by-profileurl" ^
-d "spider_parameters=[{\"profileurl\": \"https://www.instagram.com/marcusfaberfdp\",\"resultsLimit\": \"5\",\"start_date\": \"01-01-2025\",\"end_date\": \"03-01-2025\",\"post_type\": \"Post\"},{\"profileurl\": \"https://www.instagram.com/meta/\",\"resultsLimit\": \"5\",\"start_date\": \"03-01-2025\",\"end_date\": \"03-17-2025\",\"post_type\": \"Post\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"一、产品-抓取帖子信息:
Ins - 通过个人资料 URL 抓取帖子信息
spider_id ,所属抓取工具(必填)
它定义了要使用的抓取工具。
示例请求:
spider_id=ins_posts_by-profileurl
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=instagram.com" ^
-d "spider_id=ins_posts_by-profileurl" ^
-d "spider_parameters=[{\"profileurl\": \"https://www.instagram.com/marcusfaberfdp\",\"resultsLimit\": \"5\",\"start_date\": \"01-01-2025\",\"end_date\": \"03-01-2025\",\"post_type\": \"Post\"},{\"profileurl\": \"https://www.instagram.com/meta/\",\"resultsLimit\": \"5\",\"start_date\": \"03-01-2025\",\"end_date\": \"03-17-2025\",\"post_type\": \"Post\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"profileurl , 个人资料 URL(必填)
该参数用于指定待抓取的 Instagram 的个人资料访问 URL。
示例请求:
"profileurl": "https://www.instagram.com/marcusfaberfdp"
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=instagram.com" ^
-d "spider_id=ins_posts_by-profileurl" ^
-d "spider_parameters=[{\"profileurl\": \"https://www.instagram.com/marcusfaberfdp\",\"resultsLimit\": \"5\",\"start_date\": \"01-01-2025\",\"end_date\": \"03-01-2025\",\"post_type\": \"Post\"},{\"profileurl\": \"https://www.instagram.com/meta/\",\"resultsLimit\": \"5\",\"start_date\": \"03-01-2025\",\"end_date\": \"03-17-2025\",\"post_type\": \"Post\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"resultsLimit ,最大帖子数(必填)
该参数用于指定抓取帖子的最大数量。
示例请求:
"resultsLimit": "5"
curl -X POST "https://scraperapi.thordata.com/builder" ^
-H "Authorization: Bearer Token-ID" ^
-H "Content-Type: application/x-www-form-urlencoded" ^
-d "spider_name=instagram.com" ^
-d "spider_id=ins_posts_by-profileurl" ^
-d "spider_parameters=[{\"profileurl\": \"https://www.instagram.com/marcusfaberfdp\",\"resultsLimit\": \"5\",\"start_date\": \"01-01-2025\",\"end_date\": \"03-01-2025\",\"post_type\": \"Post\"},{\"profileurl\": \"https://www.instagram.com/meta/\",\"resultsLimit\": \"5\",\"start_date\": \"03-01-2025\",\"end_date\": \"03-17-2025\",\"post_type\": \"Post\"}]" ^
-d "spider_errors=true" ^
-d "file_name={{TasksID}}"Ins - 通过帖子 URL 抓取帖子详细信息
posturl , 帖子 URL(必填)
该参数用于指定待抓取的 Instagram 的帖子 URL。
示例请求:
"posturl": "https://www.instagram.com/p/Cuf4s0MNqNr"
二、产品-抓取 Ins 个人信息:
Ins - 通过用户名抓取个人信息
Ins - 通过 URL 抓取个人信息
profileurl , 个人资料 URL(必填)
该参数用于指定待抓取的 Instagram 的个人资料访问 URL。
示例请求:
"profileurl": "https://www.instagram.com/cats_of_world_/"
三、产品 - 抓取 Ins 帖子评论信息
Ins - 通过帖子 URL 抓取帖子评论信息
posturl , 帖子 URL(必填)
该参数用于指定待抓取的 Instagram 的帖子 URL。
示例请求:
"posturl": "https://www.instagram.com/cats_of_instagram/reel/C4GLo_eLO2e/"
isNewestComments ,抓取最新评论(可选)
该参数用于指定抓取评论时,评论列表是否按照最新时间排序。 参数值:true false
示例请求:
"isNewestComments": "true"
includeNestedComments ,抓取回复(可选)
该参数用于指定抓取是否抓取评论的回复内容。 参数值:true false
示例请求:
"includeNestedComments": "true"
四、产品 - 抓取 Ins Reel 信息
1、 Ins - 通过 URL 抓取 Reel 信息
url , URL(必填)
该参数用于指定待抓取的 Instagram 的访问 URL 地址。
示例请求:
"url": "https://www.instagram.com/reel/C5Rdyj_q7YN/"
2、 Ins - 通过列表 URL 抓取 Reel 信息
3、 Ins - 通过网址抓取 Reel 信息
如果您需要进一步的帮助,请通过电子邮件联系 [email protected]。
Last updated
Was this helpful?