Introdução à governança de dados no BigQuery

Neste documento, apresentamos uma introdução à governança de dados do BigQuery e explicamos como usar os recursos do BigQuery para implementar e aplicar políticas de governança de dados do BigQuery. Para uma visão geral mais abrangente da governança de dados no Google Cloud, consulte O que é governança de dados?

A governança de dados é o gerenciamento da segurança e da qualidade dos dados em todo o ciclo de vida para garantir que o acesso e a precisão estejam de acordo com as políticas e regulamentos organizacionais. Essas prioridades podem ser divididas em três categorias:

As seções a seguir definem essas categorias de governança de dados, discutem como os recursos do BigQuery oferecem suporte a elas e recomendam as próximas etapas para você.

Controle de acesso

O gerenciamento de acesso aos dados é o processo de definir, aplicar e monitorar as regras e políticas que regem quem tem acesso aos dados. Com o gerenciamento de acesso, os dados só podem ser acessados pelas pessoas autorizadas. O BigQuery oferece os seguintes recursos para ajudar você no acesso aos dados:

  • Identity and Access Management (IAM). Com o IAM, você controla quem tem acesso aos recursos do BigQuery, como projetos, conjuntos de dados, tabelas e visualizações. É possível conceder papéis do IAM a usuários, grupos e contas de serviço. Esses papéis definem o que eles podem fazer com seus recursos.
  • Controles de acesso no nível da coluna e controles de acesso no nível da linha. Os controles de acesso no nível da coluna e da linha permitem restringir o acesso a colunas e linhas específicas em uma tabela, com base em atributos do usuário ou valores de dados. Esse controle permite que você implemente acesso refinado para ajudar a proteger dados confidenciais contra acesso não autorizado.
  • Gerenciamento da Transferência de dados. Com o VPC Service Controls, é possível criar perímetros em torno dos recursos do Google Cloud e controlar o acesso a eles com base nas políticas da organização.
  • Registros de auditoria. Os registros de auditoria fornecem um registro detalhado da atividade do usuário e dos eventos do sistema na sua organização. Esses registros ajudam a aplicar políticas de governança de dados e a identificar possíveis riscos de segurança.

Próximas etapas para o controle de acesso

A tabela a seguir descreve as próximas etapas que você pode seguir para saber mais sobre os recursos de controle de acesso:

Nível de experiência Programa de aprendizado
Novos usuários da nuvem
Usuários experientes da nuvem

Administração de dados

A gestão de dados ajuda a proteger os dados sensíveis, categorizando, mascarando, editando ou criptografando-os adequadamente durante a consulta, o trânsito ou o armazenamento. Essa abordagem aprimora a proteção e a organização dos dados. O BigQuery fornece os seguintes recursos para ajudar você com a gestão de dados:

  • Mascaramento de dados. Com o mascaramento de dados, é possível ocultar dados confidenciais em uma tabela e, ao mesmo tempo, permitir que usuários autorizados acessem os dados próximos. Ele também pode mascarar dados que correspondem a padrões de dados sensíveis, protegendo contra divulgação acidental de dados.
  • Criptografia. O BigQuery automaticamente criptografa todos os dados em repouso e em trânsito , além de permitir a personalização das configurações de criptografia para atender às suas necessidades e requisitos específicos.
  • Gerenciamento de metadados. O gerenciamento de metadados permite marcar recursos, o que, por sua vez, ajuda na pesquisa, organização e categorização de dados.

Próximas etapas para a gestão de dados

A tabela abaixo descreve as próximas etapas que você pode seguir para saber mais sobre os recursos de gerenciamento de dados:

Nível de experiência Programa de aprendizado
Novos usuários da nuvem
Usuários experientes da nuvem
  • Adicione o mascaramento de dados no nível da coluna à tabela para facilitar o compartilhamento de informações por meio da organização sem revelar dados confidenciais.
  • Use a Proteção de dados sensíveis para verificar seus dados em busca de informações confidenciais e de alto risco, como informações de identificação pessoal (PII), dados financeiros e informações de saúde de dois minutos.

Qualidade dos dados

O gerenciamento da qualidade de dados é o processo de rastrear a linhagem de dados e garantir que eles atendam aos seus padrões de precisão, integridade e consistência. O BigQuery oferece os seguintes recursos para ajudar na qualidade de dados:

  • Linhagem de dados. A linhagem de dados permite rastrear o fluxo dos dados ao longo do tempo, fornecendo insights sobre a origem, como eles mudam ao longo do tempo e o destino final no sistema.
  • Verificações de perfil de dados. As verificações de perfil de dados permitem analisar as características estatísticas dos dados, como valores médios e exclusivos.
  • Verificações de qualidade de dados. As verificações de qualidade de dados permitem realizar verificações de dados, validar seus dados em relação às regras definidas e resolver problemas de qualidade de dados.

Próximas etapas para a qualidade de dados

A tabela abaixo descreve as próximas etapas que você pode seguir para saber mais sobre o acesso aos recursos de qualidade de dados:

Nível de experiência Programa de aprendizado
Novos usuários da nuvem
Usuários experientes da nuvem

A seguir