BigQuery 中的数据治理简介

本文档介绍了 BigQuery 数据治理,并说明了如何使用 BigQuery 功能来实现和强制执行 BigQuery 数据治理政策。如需详细了解 Google Cloud 中的数据治理,请参阅什么是数据治理?

数据治理是指在整个数据生命周期中管理数据的安全性和质量,以确保访问和准确性符合组织政策和法规。这些数据治理优先级可分为三个类别:

以下几个部分定义了这些数据治理类别,讨论了 BigQuery 功能如何支持它们,并为您建议后续步骤。

访问权限控制

数据访问管理是定义、强制执行和监控用于管理谁有权访问数据的规则和政策的过程。访问管理可确保数据仅可供有权访问数据的人员访问。BigQuery 提供以下功能来帮助您进行数据访问:

  • Identity and Access Management (IAM)借助 IAM,您可以控制谁有权访问您的 BigQuery 资源(例如项目、数据集、表和视图)。您可以向用户、群组和服务账号授予 IAM 角色。这些角色定义了它们可以对您的资源执行的操作。
  • 列级访问权限控制行级访问权限控制通过列级和行级访问权限控制,您可以根据用户属性或数据值来限制对表中特定列和行的访问。此控件让您可实施精细的访问,以帮助保护敏感数据免遭未经授权的访问。
  • 数据传输管理使用 VPC Service Controls,您可以为 Google Cloud 资源创建边界,并根据组织的政策控制对这些资源的访问。
  • 审核日志审核日志为您提供了组织中的用户活动和系统事件的详细记录。这些日志可帮助您强制执行数据治理政策并识别潜在的安全风险。

访问权限控制的后续步骤

下表概述了您可以执行的后续步骤,以详细了解访问权限控制功能:

经验等级 学习路线
新的云用户
经验丰富的云用户

数据监管

数据监管在查询、传输或存储期间对数据进行适当分类、遮盖、隐去或加密,从而帮助您保护敏感数据。此方法可增强数据保护和组织方式。BigQuery 提供以下功能来帮助您进行数据监管:

  • 数据遮盖通过数据遮盖,您可以遮盖表中的敏感数据,同时仍允许已获授权的用户访问周围的数据。还可以遮盖与敏感数据模式匹配的数据,防止意外泄露数据。
  • 加密BigQuery 自动加密所有静态数据传输中数据,同时允许您自定义加密设置,以满足您的特定需求和要求。
  • 元数据管理利用元数据管理,您可标记资源,而这反过来又可以帮助您进行数据搜索、组织和分类。

数据监管的后续步骤

下表概述了让您可详细了解数据监管功能的后续步骤:

经验等级 学习路线
新的云用户
  • 了解默认情况下,Google 如何对静态数据和传输中数据进行加密。
经验丰富的云用户
  • 向表中添加列级数据遮盖,以便更轻松地通过组织共享信息,而不会泄露敏感数据。
  • 使用 Sensitive Data Protection 扫描数据中的敏感信息和高风险信息,例如个人身份信息 (PII)、财务数据和健康信息。

数据质量

数据质量管理是跟踪数据沿袭并确保数据符合准确性、完整性和一致性的标准的过程。BigQuery 提供以下功能来帮助您提高数据质量:

  • 数据沿袭借助数据沿袭,您可以跟踪数据流随时间变化的情况,从而深入了解数据的来源、数据随时间的变化以及系统内的最终目标。
  • 数据分析扫描数据分析扫描让您可分析数据的统计特征,例如平均值和唯一值。
  • 数据质量扫描通过数据质量扫描,您可以执行数据检查,根据定义的规则验证数据,以及排查数据质量问题。

数据质量的后续步骤

下表概述了您可以执行的后续步骤,以详细了解访问数据质量功能:

经验等级 学习路线
新的云用户
  • 运行数据分析扫描,以深入了解您的数据,包括数据的限制或平均值。
经验丰富的云用户

后续步骤