BigQuery 中的数据治理简介
本文档介绍了 BigQuery 数据治理,并说明了如何使用 BigQuery 功能来实现和强制执行 BigQuery 数据治理政策。如需详细了解 Google Cloud 中的数据治理,请参阅什么是数据治理?
数据治理是指在整个数据生命周期中管理数据的安全性和质量,以确保访问和准确性符合组织政策和法规。这些数据治理优先级可分为三个类别:
以下几个部分定义了这些数据治理类别,讨论了 BigQuery 功能如何支持它们,并为您建议后续步骤。
访问权限控制
数据访问管理是定义、强制执行和监控用于管理谁有权访问数据的规则和政策的过程。访问管理可确保数据仅可供有权访问数据的人员访问。BigQuery 提供以下功能来帮助您进行数据访问:
- Identity and Access Management (IAM)。借助 IAM,您可以控制谁有权访问您的 BigQuery 资源(例如项目、数据集、表和视图)。您可以向用户、群组和服务账号授予 IAM 角色。这些角色定义了它们可以对您的资源执行的操作。
- 列级访问权限控制和行级访问权限控制。通过列级和行级访问权限控制,您可以根据用户属性或数据值来限制对表中特定列和行的访问。此控件让您可实施精细的访问,以帮助保护敏感数据免遭未经授权的访问。
- 数据传输管理。使用 VPC Service Controls,您可以为 Google Cloud 资源创建边界,并根据组织的政策控制对这些资源的访问。
- 审核日志。审核日志为您提供了组织中的用户活动和系统事件的详细记录。这些日志可帮助您强制执行数据治理政策并识别潜在的安全风险。
访问权限控制的后续步骤
下表概述了您可以执行的后续步骤,以详细了解访问权限控制功能:
经验等级 | 学习路线 |
---|---|
新的云用户 | |
经验丰富的云用户 |
|
数据监管
数据监管在查询、传输或存储期间对数据进行适当分类、遮盖、隐去或加密,从而帮助您保护敏感数据。此方法可增强数据保护和组织方式。BigQuery 提供以下功能来帮助您进行数据监管:
- 数据遮盖。通过数据遮盖,您可以遮盖表中的敏感数据,同时仍允许已获授权的用户访问周围的数据。还可以遮盖与敏感数据模式匹配的数据,防止意外泄露数据。
- 加密。BigQuery 自动加密所有静态数据和传输中数据,同时允许您自定义加密设置,以满足您的特定需求和要求。
- 元数据管理。利用元数据管理,您可标记资源,而这反过来又可以帮助您进行数据搜索、组织和分类。
数据监管的后续步骤
下表概述了让您可详细了解数据监管功能的后续步骤:
经验等级 | 学习路线 |
---|---|
新的云用户 | |
经验丰富的云用户 |
|
数据质量
数据质量管理是跟踪数据沿袭并确保数据符合准确性、完整性和一致性的标准的过程。BigQuery 提供以下功能来帮助您提高数据质量:
- 数据沿袭。借助数据沿袭,您可以跟踪数据流随时间变化的情况,从而深入了解数据的来源、数据随时间的变化以及系统内的最终目标。
- 数据分析扫描。数据分析扫描让您可分析数据的统计特征,例如平均值和唯一值。
- 数据质量扫描。通过数据质量扫描,您可以执行数据检查,根据定义的规则验证数据,以及排查数据质量问题。
数据质量的后续步骤
下表概述了您可以执行的后续步骤,以详细了解访问数据质量功能:
经验等级 | 学习路线 |
---|---|
新的云用户 |
|
经验丰富的云用户 |
后续步骤
- 了解在 Google 进行身份验证。
- 了解 Google Cloud 上的数据删除。
- 详细了解 IAM 最佳做法。
- 了解 Google Cloud 上的资源层次结构。
- 了解 Google Cloud 上的 IAM。