Introdução à governança de dados no BigQuery
Neste documento, apresentamos uma introdução à governança de dados do BigQuery e explicamos como usar os recursos do BigQuery para implementar e aplicar políticas de governança de dados do BigQuery. Para uma visão geral mais abrangente da governança de dados no Google Cloud, consulte O que é governança de dados?
A governança de dados é o gerenciamento da segurança e da qualidade dos dados em todo o ciclo de vida para garantir que o acesso e a precisão estejam de acordo com as políticas e regulamentos organizacionais. Essas prioridades podem ser divididas em três categorias:
As seções a seguir definem essas categorias de governança de dados, discutem como os recursos do BigQuery oferecem suporte a elas e recomendam as próximas etapas para você.
Controle de acesso
O gerenciamento de acesso aos dados é o processo de definir, aplicar e monitorar as regras e políticas que regem quem tem acesso aos dados. Com o gerenciamento de acesso, os dados só podem ser acessados pelas pessoas autorizadas. O BigQuery oferece os seguintes recursos para ajudar você no acesso aos dados:
- Identity and Access Management (IAM). Com o IAM, você controla quem tem acesso aos recursos do BigQuery, como projetos, conjuntos de dados, tabelas e visualizações. É possível conceder papéis do IAM a usuários, grupos e contas de serviço. Esses papéis definem o que eles podem fazer com seus recursos.
- Controles de acesso no nível da coluna e controles de acesso no nível da linha. Os controles de acesso no nível da coluna e da linha permitem restringir o acesso a colunas e linhas específicas em uma tabela, com base em atributos do usuário ou valores de dados. Esse controle permite que você implemente acesso refinado para ajudar a proteger dados confidenciais contra acesso não autorizado.
- Gerenciamento da Transferência de dados. Com o VPC Service Controls, é possível criar perímetros em torno dos recursos do Google Cloud e controlar o acesso a eles com base nas políticas da organização.
- Registros de auditoria. Os registros de auditoria fornecem um registro detalhado da atividade do usuário e dos eventos do sistema na sua organização. Esses registros ajudam a aplicar políticas de governança de dados e a identificar possíveis riscos de segurança.
Próximas etapas para o controle de acesso
A tabela a seguir descreve as próximas etapas que você pode seguir para saber mais sobre os recursos de controle de acesso:
Nível de experiência | Programa de aprendizado |
---|---|
Novos usuários da nuvem |
|
Usuários experientes da nuvem |
|
Administração de dados
A gestão de dados ajuda a proteger os dados sensíveis, categorizando, mascarando, editando ou criptografando-os adequadamente durante a consulta, o trânsito ou o armazenamento. Essa abordagem aprimora a proteção e a organização dos dados. O BigQuery fornece os seguintes recursos para ajudar você com a gestão de dados:
- Mascaramento de dados. Com o mascaramento de dados, é possível ocultar dados confidenciais em uma tabela e, ao mesmo tempo, permitir que usuários autorizados acessem os dados próximos. Ele também pode mascarar dados que correspondem a padrões de dados sensíveis, protegendo contra divulgação acidental de dados.
- Criptografia. O BigQuery automaticamente criptografa todos os dados em repouso e em trânsito , além de permitir a personalização das configurações de criptografia para atender às suas necessidades e requisitos específicos.
- Gerenciamento de metadados. O gerenciamento de metadados permite marcar recursos, o que, por sua vez, ajuda na pesquisa, organização e categorização de dados.
Próximas etapas para a gestão de dados
A tabela abaixo descreve as próximas etapas que você pode seguir para saber mais sobre os recursos de gerenciamento de dados:
Nível de experiência | Programa de aprendizado |
---|---|
Novos usuários da nuvem |
|
Usuários experientes da nuvem |
|
Qualidade dos dados
O gerenciamento da qualidade de dados é o processo de rastrear a linhagem de dados e garantir que eles atendam aos seus padrões de precisão, integridade e consistência. O BigQuery oferece os seguintes recursos para ajudar na qualidade de dados:
- Linhagem de dados. A linhagem de dados permite rastrear o fluxo dos dados ao longo do tempo, fornecendo insights sobre a origem, como eles mudam ao longo do tempo e o destino final no sistema.
- Verificações de perfil de dados. As verificações de perfil de dados permitem analisar as características estatísticas dos dados, como valores médios e exclusivos.
- Verificações de qualidade de dados. As verificações de qualidade de dados permitem realizar verificações de dados, validar seus dados em relação às regras definidas e resolver problemas de qualidade de dados.
Próximas etapas para a qualidade de dados
A tabela abaixo descreve as próximas etapas que você pode seguir para saber mais sobre o acesso aos recursos de qualidade de dados:
Nível de experiência | Programa de aprendizado |
---|---|
Novos usuários da nuvem |
|
Usuários experientes da nuvem |
|
A seguir
- Saiba mais sobre autenticação no Google.
- Saiba mais sobre a exclusão de dados no Google Cloud.
- Saiba mais sobre as práticas recomendadas do IAM.
- Saiba mais sobre a hierarquia de recursos no Google Cloud.
- Saiba mais sobre o IAM no Google Cloud.