本文档介绍了如何通过对象上下文将情境信息附加到对象,以帮助您管理和发现数据。
如需了解如何附加和管理对象上下文,请参阅使用对象上下文。
概览
借助对象上下文,您可以将描述性信息以键值对的形式附加到 Cloud Storage 对象。您可以在对象中嵌入上下文,以改进数据分类、跟踪和搜索方式。您可以在创建新对象时应用上下文,也可以向现有对象添加上下文。
例如,当您上传账单对象时,可以使用 customer_id
和 payment_status
上下文来丰富该对象:
{ "contexts": { "custom": { "customer_id": { "value": "cust-78901" }, "payment_status": { "value": "unpaid" } } } }
对象上下文的应用场景
借助对象上下文,您可以对数据进行分类、跟踪和丰富。以下部分介绍了使用对象上下文管理不同类型信息的场景。
对对象进行分组和分类
对存储桶和项目中的对象进行分类和整理。使用上下文按数据集来源、所有权或成本中心等属性标记数据。
示例 1:为包含个人身份信息 (PII) 的对象分配
data_classification: PII
上下文,以便合规性政策可以处理这些对象。示例 2:在注入期间通过分配
batch_id: 2025_Q4_Model_Run
上下文对新的训练图片进行分组,以实现高效的模型测试和检索。
跟踪工作流
为了优化自定义工作流并防止冗余操作,请将工作流状态信息直接嵌入到对象中,以跟踪它们在处理流水线中的历程。
示例 1:使用
processing_status: awaiting_review
表示对象正在等待外部发布审批。示例 2:使用
processed_by: analytics_pipeline
防止自定义数据处理服务重新扫描已完成某个阶段的文件。
使用特定于应用的上下文来丰富对象
附加有关应用或业务流程的特定信息,以便为每个对象提供额外的背景信息和数据沿袭。
示例 1:对于卫星图像,记录拍摄详细信息(例如
capture_angle: 45deg_NW
),或使用lineage: ingested_from_s3
跟踪文件的历史记录。示例 2:嵌入有关文件内容的详细信息,例如
document_type: service_manual
和vehicle_model: f250
。
对象上下文的优势
对象上下文扩展了 Cloud Storage 对象的功能。通过将自定义键值对直接与存储的对象相关联,您可以获得以下好处:
数据发现:对象上下文有助于过滤对象列表,从而将工作负载的输入限制为仅包含感兴趣的对象。
互操作性:对象上下文接受未预定义的字符串值,以支持与其他云提供商的对象标记的互操作性并简化迁移。
数据持久性:上下文数据在对象的整个生命周期内保持不变。 当您复制、重写、撰写、移动或恢复对象时,上下文会自动转移。保留对象上下文有助于所有关联的上下文数据保持与对象的关联,无论其存储位置或状态发生任何变化。
对上下文修改的 Identity and Access Management 控制:使用 Identity and Access Management (IAM) 权限来定义谁可以添加、更改或移除上下文,以保持可靠的审核轨迹。
后续步骤
- 了解如何使用对象上下文。