Storage Transfer Service 中的元数据保留

本文档介绍了使用 Storage Transfer Service 和 Transfer Service for On Premises Data 将数据转移到 Cloud Storage 时保留的元数据。

概览

Storage Transfer Service 和本地转移服务在转移到 Cloud Storage 的过程中会保留以下元数据:

  • 用户为源自 Cloud Storage、Amazon Simple Storage Service (Amazon S3) 或 Microsoft Azure Blob Storage (Microsoft Azure Storage) 转移作业创建的自定义元数据

  • 源自 POSIX 文件系统的转移作业的文件大小和最后修改时间 (mtime)。

本文档中未明确涉及的元数据字段不会保留。

对象和文件元数据

Cloud Storage 中的每个对象都具有与该对象关联的元数据,以 key:value 对的形式存储。元数据标识对象的属性以及对象被访问时的处理方式。如需详细了解 Cloud Storage 中的对象元数据,请参阅对象元数据

以下部分介绍了 Cloud Storage 中元数据的可变性:

  • 可修改的元数据:如果您拥有足够的权限,则可以修改这些元数据值。以下是 Cloud Storage 中提供的可修改的元数据类型:

    • 固定键元数据:固定键元数据的值可以更改,但键不能。这种类型的元数据通常对应于 HTTP 标头。如需了解详情,请参阅固定键元数据

    • 自定义元数据:自定义元数据的值和键都可以更改。如需了解详情,请参阅自定义元数据

  • 不可修改的元数据:此类元数据无法直接修改。在 Cloud Storage 中创建或重写对象时,系统会设置此参数。如需了解详情,请参阅不可修改的元数据

文件元数据包含有关文件和目录的信息。POSIX 文件系统中的文件元数据示例包括 mtime、文件大小、文件模式和文件所有权。

元数据保留行为

以下部分列出了来自不同来源存储系统的元数据示例,以及 Storage Transfer Service 和本地转移服务如何保留每种系统的元数据。如需完整的元数据列表,请参阅源存储系统的文档。

Amazon S3 到 Cloud Storage

元数据示例 保留行为
Amazon S3 固定键元数据字段,例如:Cache-ControlContent-DispositionContent-Type 以固定键元数据形式保留。
Amazon S3 用户定义的元数据,格式为键值对。如需了解详情,请参阅对象键和元数据用户定义的对象元数据部分。

以目标 Cloud Storage 对象中的自定义元数据字段形式保留,您可以稍后进行修改或移除。

ETag 以自定义元数据字段形式保留,且键为 x-goog-source-etag,您可以稍后进行修改或移除。
对象大小。 size 形式保留。
Amazon S3 访问控制列表 (ACL) 如需完整列表,请参阅访问控制列表 (ACL) 概览条件键部分。 不保留。
Amazon S3 对象标记,由您定义为键值对。如需了解详情,请参阅对象标记 不保留。
Amazon S3 系统定义的元数据,ETag 和对象大小除外。如需查看完整列表,请参阅对象键和元数据系统定义的对象元数据部分。

不保留。

系统不会保留来自来源的时间戳元数据。创建时间 timeCreated 反映了在 Cloud Storage 中创建对象的时间。同样,updated 反映了在 Cloud Storage 中修改对象的元数据的时间。

Microsoft Azure Storage 到 Cloud Storage

元数据示例 保留行为
Microsoft Azure Storage 固定键元数据字段,例如:Cache-ControlContent-DispositionContent-Type 以固定键元数据形式保留。
Microsoft Azure Storage 用户定义的元数据,格式为键值对。如需了解详情,请参阅设置和检索 Blob 服务资源的属性和元数据

以目标 Cloud Storage 对象中的自定义元数据字段形式保留,您可以稍后进行修改或移除。

ETag 以自定义元数据字段形式保留,且键为 x-goog-source-etag,您可以稍后进行修改或移除。
对象大小。 size 形式保留。
Azure Data Lake Storage (ADLS) 第 2 代支持的 POSIX 文件系统权限。 不保留。
Microsoft Azure Storage 访问权限控制,具体来讲是 x-ms-blob-public-access。如需了解详情,请参阅获取容器 ACL响应标头部分。 不保留。
Microsoft Azure Storage 索引标记。如需了解详情,请参阅 通过 blob 索引标记管理和查找 Azure Blob 数据 不保留。
Microsoft Azure Storage 时间戳元数据,例如:Last-Modifiedx-ms-creation-timex-ms-versionx-ms-request-server-encryptedx-ms-encryption-scope。如需了解详情,请参阅设置 Blob 元数据

不保留。

系统不会保留来自来源的时间戳元数据。创建时间 timeCreated 反映了在 Cloud Storage 中创建对象的时间。同样,updated 反映了在 Cloud Storage 中修改对象的元数据的时间。

在 Cloud Storage 存储分区之间转移数据

元数据示例 保留行为

Cloud Storage 固定键元数据字段,例如:Cache-ControlContent-DispositionContent-Type

如需了解详情,请参阅对象元数据

以固定键元数据形式保留。

如果目标存储桶具有基于事件的默认保全,则 eventBasedHold 可能会被覆盖。

Cloud Storage 用户定义的元数据,格式为键值对。 如需了解详情,请参阅自定义元数据

以目标 Cloud Storage 对象中的自定义元数据字段形式保留,您可以稍后进行修改或移除。

对象大小 size 形式保留。
Cloud Storage 访问控制列表 (ACL)。如需了解详情,请参阅预定义的 ACL 不保留。
Cloud Storage 不可修改的元数据,例如:generationetagcomponentCountstorageClass 不保留。
Cloud Storage 时间戳元数据,例如:timeCreatedupdated

不保留。

系统不会保留来自来源的时间戳元数据。创建时间 timeCreated 反映了在 Cloud Storage 中创建对象的时间。同样,updated 反映了在 Cloud Storage 中修改对象的元数据的时间。

如需查看 Cloud Storage 中的元数据列表,请参阅对象

将网址列表转移到 Cloud Storage

如需详细了解网址列表,请参阅创建网址列表

元数据示例 保留行为
固定键元数据字段,例如:Cache-ControlContent-DispositionContent-Type 以可修改的元数据形式保留。
Content-LengthMD5

以不可修改的元数据形式保留。

如果来源未提供 MD5 哈希值,则我们不保留值。

此保留行为针对的是 Content-LengthMD5。任何其他未列出的不可修改的元数据都不会保留。

时间戳元数据,例如:创建时间、修改时间和其他特定于来源的元数据。

不保留。

系统不会保留来自来源的时间戳元数据。创建时间 timeCreated 反映了在 Cloud Storage 中创建对象的时间。同样,updated 反映了在 Cloud Storage 中修改对象的元数据的时间。

POSIX 文件系统到 Cloud Storage

元数据示例 保留行为
修改时间 (mtime) 和文件大小。

保留。

mtime 以自定义元数据形式保留,且键为 goog-reserved-file-mtime。文件大小以 size 形式保留。

文件夹和文件权限、用户 ID、群组 ID、文件权限、硬链接和符号链接。

不保留。

文件夹元数据不保留的原因是 Storage Transfer Service 和 Transfer Service for On Premises Data 不会在 Cloud Storage 中创建文件夹占位符对象来表示文件夹。