> For the complete documentation index, see [llms.txt](https://doc.thordata.com/doc/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://doc.thordata.com/doc/zh/web-scraper-api/ji-cheng/amazon-s3-ji-cheng.md).

# Amazon S3 集成

通过 Amazon S3 集成功能，您可以将 Web Scraper 抓取任务的结果自动上传到指定的 S3 桶中，方便数据备份、共享或后续处理和分析。

***

**集成配置：**\
**1.集成功能名称**\
为该集成任务自定义一个名称，方便后续管理和识别。建议根据用途或抓取对象命名，例如“产品评论结果上传至 S3”。

**2.事件类型设置**\
您可以根据需求选择以下两种方式之一来触发数据发送：

* **指定任务 ID**\
  适用于将已知的特定抓取任务结果发送到 S3。\
  适合处理一个抓取工具的多个任务 ID 结果。\
  多个任务 ID 请使用英文逗号分隔。\
  最多支持 10 个任务 ID。
* **跟随任务**\
  自动将该抓取工具后续产生的所有结果上传至 S3。\
  一次配置，持续生效，除非手动关闭或删除该集成任务。\
  更适合持续性抓取或周期性任务的自动化数据归档。

**3.Amazon S3 参数配置**\
配置以下信息以完成数据上传设置：

<details>

<summary><code>bucketName</code> ，<strong>目标存储桶名称（必填）</strong></summary>

目标 Amazon S3 存储桶的名称。

</details>

<details>

<summary><code>targetPath</code> ，<strong>目标路径（可选）</strong></summary>

Amazon S3 的目标位置。

</details>

<details>

<summary><code>fileName</code> ，<strong>文件名称径（可选）</strong></summary>

对象在存储桶中的名字，默认为您的任务ID。

</details>

{% tabs %}
{% tab title="访问秘钥凭证" %}
`awsAccessKey` ，**AWS访问密钥（必填）**\
用于授权上传的 AWS 访问密钥 ID。您可以从 AWS 控制台 -> IAM -> 用户 -> 创建用户/选择现有用户 -> 安全凭证 -> 访问密钥 获取。作用类似用户名。

`awsSecretKey` ，**AWS密钥（必填）**\
您的 AWS 秘密访问密钥用于授权上传。您可以从 AWS 控制台 -> IAM -> 用户 -> 创建用户/选择现有用户 -> 安全凭证 -> 访问密钥 -> 创建访问密钥获取该密钥。创建访问密钥后，该秘密访问密钥仅显示一次。作用类似密码。
{% endtab %}

{% tab title="角色令牌凭证" %}
`roleArn` ，**角色（必填）**\
RoleArn 是 AWS 中用于角色（Role）授权和切换身份的重要参数。

`externalId` ，**外部ID（必填）**\
ExternalId 是 AWS 中用于提高跨账户访问安全性的一个参数，主要用于第三方服务访问你账户中的资源场景。它是和 RoleArn 一起使用的。
{% endtab %}
{% endtabs %}

<details>

<summary><code>fileFormat</code> ，<strong>文件格式（必填）</strong></summary>

Amazon 产品的结果可以选择 JSON 格式或者 CSV 格式发送。YouTube 产品的结果只可使用文件格式进行发送。\
参数值：JSON CSV 下载链接

</details>

***

**查看传输的文件：**&#x20;

如果您集成任务的状态显示“成功”，您就可以前往您的 Amazon S3 账户中查看。 或者您可以直接通过链接访问：&#x20;

<https://s3.us-east-2.amazonaws.com/downloaddirectory/您填写的目标路径/文件名>

例如：您目标路径填写的 path/to，文件名称填写的 123，传输的文件格式是 json 。 您的访问链接就是：&#x20;

<https://s3.us-east-2.amazonaws.com/downloaddirectory/path/to/123.json>

***

如果您需要更多帮助，请通过邮箱<support@thordata.com>联系我们。


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://doc.thordata.com/doc/zh/web-scraper-api/ji-cheng/amazon-s3-ji-cheng.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
