对象上下文

本文档介绍了如何通过对象上下文将情境信息附加到对象,以帮助您管理和发现数据。

如需了解如何附加和管理对象上下文,请参阅使用对象上下文

概览

借助对象上下文,您可以将描述性信息以键值对的形式附加到 Cloud Storage 对象。您可以在对象中嵌入上下文,以改进数据分类、跟踪和搜索方式。您可以在创建新对象时应用上下文,也可以向现有对象添加上下文。

例如,当您上传账单对象时,可以使用 customer_idpayment_status 上下文来丰富该对象:

{
  "contexts": {
    "custom": {
      "customer_id": {
        "value": "cust-78901"
      },
      "payment_status": {
        "value": "unpaid"
      }
    }
  }
}

对象上下文的应用场景

借助对象上下文,您可以对数据进行分类、跟踪和丰富。以下部分介绍了使用对象上下文管理不同类型信息的场景。

对对象进行分组和分类

对存储桶和项目中的对象进行分类和整理。使用上下文按数据集来源、所有权或成本中心等属性标记数据。

  • 示例 1:为包含个人身份信息 (PII) 的对象分配 data_classification: PII 上下文,以便合规性政策可以处理这些对象。

  • 示例 2:在注入期间通过分配 batch_id: 2025_Q4_Model_Run 上下文对新的训练图片进行分组,以实现高效的模型测试和检索。

跟踪工作流

为了优化自定义工作流并防止冗余操作,请将工作流状态信息直接嵌入到对象中,以跟踪它们在处理流水线中的历程。

  • 示例 1:使用 processing_status: awaiting_review 表示对象正在等待外部发布审批。

  • 示例 2:使用 processed_by: analytics_pipeline 防止自定义数据处理服务重新扫描已完成某个阶段的文件。

使用特定于应用的上下文来丰富对象

附加有关应用或业务流程的特定信息,以便为每个对象提供额外的背景信息和数据沿袭。

  • 示例 1:对于卫星图像,记录拍摄详细信息(例如 capture_angle: 45deg_NW),或使用 lineage: ingested_from_s3 跟踪文件的历史记录。

  • 示例 2:嵌入有关文件内容的详细信息,例如 document_type: service_manualvehicle_model: f250

对象上下文的优势

对象上下文扩展了 Cloud Storage 对象的功能。通过将自定义键值对直接与存储的对象相关联,您可以获得以下好处:

  • 数据发现:对象上下文有助于过滤对象列表,从而将工作负载的输入限制为仅包含感兴趣的对象。

  • 互操作性:对象上下文接受未预定义的字符串值,以支持与其他云提供商的对象标记的互操作性并简化迁移。

  • 数据持久性:上下文数据在对象的整个生命周期内保持不变。 当您复制、重写、撰写、移动或恢复对象时,上下文会自动转移。保留对象上下文有助于所有关联的上下文数据保持与对象的关联,无论其存储位置或状态发生任何变化。

  • 对上下文修改的 Identity and Access Management 控制:使用 Identity and Access Management (IAM) 权限来定义谁可以添加、更改或移除上下文,以保持可靠的审核轨迹。

后续步骤