Gerenciar recursos de dados em um lake

Esta página explica como adicionar, fazer upgrade e remover buckets do Cloud Storage e conjuntos de dados do BigQuery como recursos em zonas do Dataplex.

Visão geral

Um recurso é mapeado para dados armazenados no Cloud Storage ou no BigQuery. É possível mapear dados armazenados em projetos separados do Google Cloud como recursos em uma única zona em um lake. É possível anexar buckets do Cloud Storage ou conjuntos de dados do BigQuery para serem gerenciados no lake.

Antes de começar

  • Crie um lake e um zona desse lake.

  • A maioria dos comandos gcloud lakes requer um local. É possível especificar o local usando a flag --location.

Controle de acesso

  • Para remover recursos, conceda os papéis do IAM que contêm as permissões dataplex.lakes.delete, dataplex.zones.delete ou dataplex.assets.delete permissões do IAM. Os papéis específicos do Dataplex roles/dataplex.admin e roles/dataplex.editor podem ser usados para conceder essas permissões.

  • Para adicionar recursos, conceda os papéis do IAM que contêm as permissões create, dataplex.lakes.create, dataplex.zones.create ou dataplex.assets.create. Os papéis roles/dataplex.admin e roles/dataplex.editor contêm estas permissões.

  • Também é possível conceder permissão a usuários ou grupos usando os papéis legados roles/owner e roles/editor.

  • É necessário autorizar o serviço do Dataplex nos recursos que estão sendo anexados ao lake do Dataplex. A autorização é concedida de forma automática e implícita para recursos no projeto em que o lago é criado. Para outros projetos, autorize o serviço do Dataplex nos recursos de forma explícita.

Para mais informações, consulte IAM e controle de acesso do Dataplex.

Atribuir papéis a buckets do Cloud Storage

Para anexar um bucket do Cloud Storage de outro projeto ao lake, precisa conceder à conta de serviço do Dataplex (service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com, recuperados da página de detalhes do lake no console), o Dataplex papel da conta de serviço (roles/dataplex.serviceAgent) no projeto que que contém o bucket. Esse papel fornece serviço do Dataplex com o papel de pré-requisito no nível do administrador no bucket para que permissões podem ser definidas no próprio bucket.

Conceder papéis para conjuntos de dados do BigQuery

Para anexar um conjunto de dados do BigQuery de outro projeto ao lake: você precisa conceder à conta de serviço do Dataplex, Administrador do BigQuery no conjunto de dados.

Considerações sobre o VPC Service Controls

O Dataplex não viola os perímetros do VPC Service Controls. Antes ao adicionar um recurso ao lake, verifique se o bucket ou conjunto de dados subjacente está usando a mesma rede VPC Service Controls que o lake.

Para mais informações, consulte VPC Service Controls com Dataplex.

Adicionar um recurso

É possível adicionar um bucket do Cloud Storage ou um conjunto de dados do BigQuery emitindo um método da API Dataplex lakes.zones.assets.create ou adicionar um bucket ou conjunto de dados na página "Zona de dados" aberta em um navegador local.

Se não houver sobreposição entre a região do lake do Dataplex e uma das regiões de buckets do Cloud Storage, não é possível adicionar do bucket para uma zona no lake.

Para saber mais sobre a localização da região de um do Cloud Storage e como o Dataplex lida com local de um bucket ao criar o conjunto de dados de publicação, consulte Recursos regionais.

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Abra o Dataplex no console do Google Cloud

  2. Na página Gerenciar, clique no lake em que você quer adicionar um bucket do Cloud Storage ou BigQuery no conjunto de dados. A página do lago é aberta.

    página de detalhes do lake
  3. Na guia Zonas, clique no nome da zona de dados em que você quer adicionar o recurso. A página da zona de dados para essa zona de dados é aberta.

  4. Na guia Recursos, clique em + Adicionar recursos. A página Adicionar recursos é aberta.

  5. Clique em Adicionar um recurso.

  6. No campo Tipo e selecione Conjunto de dados do BigQuery ou bucket do Cloud Storage.

  7. No campo Nome de exibição, digite um nome para o novo recurso.

  8. No campo ID, insira um ID exclusivo para o recurso.

  9. Opcional: digite uma Descrição.

  10. No campo Dataset ou Bucket (com base no tipo do seu recurso), clique em Procurar para encontrar e selecionar o bucket do Cloud Storage ou o conjunto de dados do BigQuery.

  11. Opcional: se o tipo de recurso for Bucket do Cloud Storage e você querer que o Dataplex gerencie o recurso, selecione a caixa de seleção Upgrade to Managed. Se você escolher essa opção, precisará fazer o upgrade do recurso separadamente. Esta opção não está disponível para conjuntos de dados do BigQuery.

  12. Clique em Continuar.

  13. Escolha o restante dos valores de parâmetro. Para mais informações sobre as configurações de segurança, consulte Segurança do Lake.

  14. Clique em Enviar para adicionar o recurso.

  15. Verifique se você retornou para a página da zona de dados e se o novo recurso aparece na lista de recursos.

REST

Siga as instruções da API para adicionar um bucket usando o APIs Explorer.

Quando a adição é bem-sucedida, a zona de dados fica automaticamente ativa estado. Se falhar, a zona de dados será revertida para a um estado íntegro.

Fazer upgrade de um recurso de bucket do Cloud Storage

Quando você adiciona um recurso do tipo bucket do Cloud Storage, O Dataplex publica automaticamente o BigQuery tabelas externas para as tabelas hospedadas no ativo.

Ao fazer upgrade de um recurso de bucket do Cloud Storage, O Dataplex remove as tabelas externas anexadas e cria Tabelas do BigLake. As tabelas do BigLake oferecem suporte a uma segurança mais refinada, incluindo mascaramento de dados dinâmico nos níveis de linha e coluna.

É possível fazer upgrade de um recurso de bucket do Cloud Storage no console do Google Cloud ou emitindo o método da API Dataplex Patch:

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Acesse o Dataplex.

  2. Na página Gerenciar, clique no nome do lake. A página "Lake" será aberta.

  3. Na guia Zonas, clique no nome da zona de dados. O a página da zona de dados será aberta.

  4. Na guia Recursos, clique no nome do recurso que você quer atualizar.

  5. Clique em Fazer upgrade para "Gerenciado".

REST

Siga as instruções da API para atualizar um recurso de bucket usando o Cloud Explorer.

Fazer downgrade de um recurso de bucket do Cloud Storage

Quando você faz downgrade de um recurso de bucket do Cloud Storage, O Dataplex remove os arquivos tabelas do BigLake e cria em tabelas externas.

É possível fazer downgrade de um recurso de bucket do Cloud Storage no console do Google Cloud ou emitindo o método da API Dataplex Patch, com o campo readAccessMode definido como DIRECT em ResourceSpec

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Acesse o Dataplex.

  2. Na página Gerenciar, clique no nome do lake. A página do lago é aberta.

  3. Na guia Zonas, clique no nome da zona de dados. O a página da zona de dados será aberta.

  4. Na guia Recursos, clique no nome do recurso que você quer atualizar.

  5. Clique em Fazer downgrade do modo gerenciado.

REST

Siga as instruções da API para fazer downgrade de um recurso do bucket. usando o Cloud Explorer. Defina o campo readAccessMode como DIRECT em ResourceSpec.

Remover um recurso

É possível remover um bucket do Cloud Storage ou um recurso de conjunto de dados do BigQuery no console do Google Cloud ou emitindo o método lakes.zones.assets.delete da API Dataplex. Remova o recurso da zona ou do data lake antes de anexá-lo a outro.

As instruções a seguir demonstram como remover um recurso do Dataplex usando o console do Google Cloud ou a API Dataplex.

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Abra o Dataplex na Console do Google Cloud

  2. Na página Gerenciar, clique no lake de onde você quer remover um bucket do Cloud Storage ou um conjunto de dados do BigQuery. A página do lago é aberta.

    página de detalhes do lake
  3. Na guia Zonas, clique no nome da zona de dados como remover o bucket do Cloud Storage ou o BigQuery conjunto de dados. A página da zona de dados é aberta.

  4. Na guia Recursos, marque a caixa à esquerda para selecionar o recurso. do nome do recurso.

  5. Clique em Excluir recurso para removê-lo.

  6. Na caixa de diálogo, clique em Excluir para confirmar a remoção.

REST

Siga as instruções da API para remover um bucket. usando o Cloud Explorer.

A seguir