BigQuery 中的数据治理简介
本文档介绍了 BigQuery 数据治理,并说明了如何使用 BigQuery 功能来实施和强制执行 BigQuery 数据治理政策。如需更全面地了解 Google Cloud中的数据治理,请参阅什么是数据治理?
数据治理是指在数据的整个生命周期内管理数据的安全性和质量,以确保访问权限和准确性符合组织政策和法规。这些数据治理优先级可分为三个类别:
以下几个部分定义了这些数据治理类别,讨论了 BigQuery 功能如何支持它们,并为您建议后续步骤。
访问权限控制
数据访问管理是定义、强制执行和监控用于管理谁有权访问数据的规则和政策的过程。访问权限管理可确保只有获得授权的用户才能访问数据。BigQuery 提供以下功能来帮助您处理数据访问权限:
- Identity and Access Management (IAM)。借助 IAM,您可以控制哪些人有权访问您的 BigQuery 资源,例如项目、数据集、表和视图。您可以向用户、群组和服务账号授予 IAM 角色。这些角色定义了他们可以对您的资源执行的操作。
- 列级访问权限控制和行级访问权限控制。通过列级和行级访问权限控制,您可以根据用户属性或数据值来限制对表中特定列和行的访问。此控件让您可实施精细的访问,以帮助保护敏感数据免遭未经授权的访问。
- 数据传输管理。借助 VPC Service Controls,您可以围绕 Google Cloud资源创建边界,并根据组织的政策控制对这些资源的访问。
- 审核日志。审核日志会详细记录组织中的用户活动和系统事件。这些日志可帮助您强制执行数据治理政策并识别潜在的安全风险。
针对访问权限控制的后续步骤
下表概述了您可以执行的后续步骤,以详细了解访问权限控制功能:
经验等级 | 学习路线 |
---|---|
新的云用户 | |
经验丰富的云用户 |
|
数据监管
数据监管在查询、传输或存储期间对数据进行适当分类、遮盖、隐去或加密,从而帮助您保护敏感数据。此方法可增强数据保护和组织方式。BigQuery 提供以下功能来帮助您进行数据监管:
- 数据遮盖。借助数据遮盖功能,您可以遮盖表中的敏感数据,同时仍允许授权用户访问周围的数据。它还可以遮盖与敏感数据模式匹配的数据,以防止意外泄露数据。
- 加密。BigQuery 自动加密所有静态数据和传输中数据,同时允许您自定义加密设置,以满足您的特定需求和要求。
- 元数据管理。利用元数据管理,您可标记资源,而这反过来又可以帮助您进行数据搜索、组织和分类。
针对数据监管的后续步骤
下表概述了让您可详细了解数据监管功能的后续步骤:
经验等级 | 学习路线 |
---|---|
新的云用户 | |
经验丰富的云用户 |
|
数据质量
数据质量管理是指跟踪数据沿袭并确保数据符合准确性、完整性和一致性标准的过程。BigQuery 提供以下功能来帮助您处理数据质量:
- 数据沿袭。借助数据沿袭,您可以跟踪数据在一段时间内的流动,深入了解数据的来源、随时间的变化情况以及在系统中的最终目标。
- 数据分析扫描。数据分析扫描让您可分析数据的统计特征,例如平均值和唯一值。
- 数据质量扫描。通过数据质量扫描,您可以执行数据检查,根据定义的规则验证数据,以及排查数据质量问题。
针对数据质量的后续步骤
下表概述了您可以执行的后续步骤,以详细了解访问数据质量功能:
经验等级 | 学习路线 |
---|---|
新的云用户 |
|
经验丰富的云用户 |
后续步骤
- 了解如何在 Google 进行身份验证。
- 了解 Google Cloud 上的数据删除机制。
- 详细了解 IAM 最佳做法。
- 了解 Google Cloud 上的资源层次结构。
- 了解 Google Cloud 中的 IAM。