Gestisci gli asset di dati in un lake

Questa pagina spiega come aggiungere, eseguire l'upgrade e rimuovere i bucket Cloud Storage e i set di dati BigQuery come asset nelle zone Dataplex esistenti.

Panoramica

Un asset viene mappato ai dati archiviati in Cloud Storage o BigQuery. Puoi mappare i dati archiviati in progetti Google Cloud separati come asset in una singola zona all'interno di un lake. Puoi collegare bucket Cloud Storage o set di dati BigQuery esistenti da gestire all'interno del lake.

Prima di iniziare

  • Se non l'hai ancora fatto, crea un lake e una zona al suo interno.

  • La maggior parte dei comandi gcloud lakes richiede una località. Puoi specificare la località utilizzando il flag --location.

Ruoli obbligatori

  • Per rimuovere gli asset, concedi i ruoli IAM contenenti le autorizzazioni IAM dataplex.lakes.delete, dataplex.zones.delete o dataplex.assets.delete. Per concedere queste autorizzazioni, puoi utilizzare i ruoli roles/dataplex.admin e roles/dataplex.editor specifici di Dataplex.

  • Per aggiungere asset, concedi i ruoli IAM contenenti le autorizzazioni create - dataplex.lakes.create, dataplex.zones.create o dataplex.assets.create. I ruoli roles/dataplex.admin e roles/dataplex.editor contengono queste autorizzazioni.

  • Puoi anche concedere l'autorizzazione a utenti o gruppi utilizzando i ruoli precedenti roles/owner e roles/editor.

  • Devi autorizzare il servizio Dataplex sulle risorse collegate al lake Dataplex. L'autorizzazione viene concessa automaticamente e implicitamente per le risorse del progetto in cui viene creato il lake. Per gli altri progetti, autorizza esplicitamente il servizio Dataplex sulle risorse.

Per ulteriori informazioni, consulta IAM e controllo dell'accesso di Dataplex.

Concedi i ruoli per i bucket Cloud Storage

Per collegare un bucket Cloud Storage di un altro progetto al tuo lake, devi assegnare all'account di servizio Dataplex (service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com, recuperato dalla pagina dei dettagli del lake nella console) il ruolo dell'account di servizio Dataplex (roles/dataplex.serviceAgent) nel progetto che contiene il bucket. Questo ruolo fornisce al servizio Dataplex il ruolo a livello di amministratore prerequisito sul bucket in modo che sia possibile impostare le autorizzazioni sul bucket stesso.

Concedi i ruoli per i set di dati BigQuery

Per collegare un set di dati BigQuery di un altro progetto al tuo lake, devi concedere all'account di servizio Dataplex il ruolo Amministratore BigQuery nel set di dati.

Considerazioni sui Controlli di servizio VPC

Dataplex non viola i perimetri dei Controlli di servizio VPC. Prima di aggiungere una risorsa al lake, assicurati che il bucket o il set di dati di base sia nella stessa rete Controlli di servizio VPC del lake.

Per saperne di più, consulta Controlli di servizio VPC con Dataplex.

Aggiungi un asset

Se non esiste alcuna sovrapposizione tra la regione del lake Dataplex e una delle regioni dei bucket Cloud Storage, non puoi aggiungere il bucket a una zona del lake.

Per scoprire di più sulla posizione della regione di un asset Cloud Storage e su come Dataplex gestisce la posizione di un bucket durante la creazione del set di dati di pubblicazione, consulta Risorse a livello di regione.

Per aggiungere un asset:

Console

  1. Nella console Google Cloud, vai alla pagina Dataplex.

    Vai a Dataplex

  2. Nella pagina Gestisci, fai clic sul lake a cui vuoi aggiungere un bucket Cloud Storage o un set di dati BigQuery. Si apre la pagina del lago.

  3. Nella scheda Zone, fai clic sul nome della zona di dati a cui vuoi aggiungere l'asset. Viene visualizzata la pagina relativa alla zona di dati.

  4. Nella scheda Asset, fai clic su + Aggiungi asset. Viene visualizzata la pagina Aggiungi asset.

  5. Fai clic su Aggiungi un asset.

  6. Nel campo Tipo, seleziona Set di dati BigQuery o Bucket Cloud Storage.

  7. Nel campo Nome visualizzato, inserisci un nome per la nuova risorsa.

  8. Nel campo ID, inserisci un ID univoco per l'asset.

  9. (Facoltativo) Inserisci una Descrizione.

  10. Nel campo Set di dati o Bucket (in base al tipo di risorsa), fai clic su Sfoglia per trovare e selezionare il bucket Cloud Storage o il set di dati BigQuery.

  11. (Facoltativo) Se il tipo di asset è Bucket Cloud Storage e vuoi che Dataplex lo gestisca, seleziona la casella di controllo Esegui l'upgrade a gestito. Se scegli questa opzione, non devi eseguire l'upgrade dell'asset separatamente. Questa opzione non è disponibile per i set di dati BigQuery.

  12. Fai clic su Continua.

  13. Scegli il resto dei valori parametro. Per ulteriori informazioni sulle impostazioni di sicurezza, consulta Sicurezza del lake.

  14. Fai clic su Invia.

  15. Verifica di aver fatto ritorno alla pagina della zona di dati e che il nuovo asset sia visualizzato nell'elenco.

REST

Per aggiungere una risorsa, utilizza il metodo lakes.zones.assets.create.

Se l'aggiunta va a buon fine, la zona di dati passa automaticamente allo stato attivo. In caso di errore, viene eseguito il rollback della zona di dati allo stato precedente corretto.

Eseguire l'upgrade di un asset bucket Cloud Storage

Quando aggiungi una risorsa di tipo bucket Cloud Storage, Dataplex pubblica automaticamente le tabelle esterne di BigQuery per le tabelle ospitate nella risorsa.

Quando esegui l'upgrade di una risorsa bucket Cloud Storage, Dataplex rimuove le tabelle esterne collegate e crea tabelle BigLake. Le tabelle BigLake supportano una sicurezza più granulare, tra cui il mascheramento dei dati a livello di riga, di colonna e dinamico.

Per eseguire l'upgrade di un asset bucket Cloud Storage:

Console

  1. Nella console Google Cloud, vai alla pagina Dataplex.

    Vai a Dataplex

  2. Nella pagina Gestisci, fai clic sul nome del lake. Si apre la pagina del lago.

  3. Nella scheda Zone, fai clic sul nome della zona di dati. Viene aperta la pagina della zona di dati.

  4. Nella scheda Asset, fai clic sul nome della risorsa di cui vuoi eseguire l'upgrade.

  5. Fai clic su Esegui l'upgrade a gestito.

REST

Per eseguire l'upgrade di una risorsa del bucket, utilizza il metodo lakes.zones.assets.patch.

Eseguire il downgrade di un asset bucket Cloud Storage

Quando esegui il downgrade di un asset bucket Cloud Storage, Dataplex rimuove le tabelle BigLake collegate e crea tabelle esterne.

Console

  1. Nella console Google Cloud, vai alla pagina Dataplex.

    Vai a Dataplex

  2. Nella pagina Gestisci, fai clic sul nome del lake. Si apre la pagina del lago.

  3. Nella scheda Zone, fai clic sul nome della zona di dati. Viene aperta la pagina della zona di dati.

  4. Nella scheda Asset, fai clic sul nome della risorsa di cui vuoi eseguire l'upgrade.

  5. Fai clic su Esegui il downgrade dalla modalità gestita.

REST

Per eseguire il downgrade di un asset del bucket, utilizza il metodo lakes.zones.assets.patch. Assicurati di impostare il campo readAccessMode su DIRECT in ResourceSpec.

Rimuovere un asset

Rimuovi l'asset dalla zona o dal lago di dati prima di collegarlo a un altro.

Per rimuovere un asset:

Console

  1. Nella console Google Cloud, vai alla pagina Dataplex.

    Vai a Dataplex

  2. Nella pagina Gestisci, fai clic sul lake da cui vuoi rimuovere un bucket Cloud Storage o un set di dati BigQuery. Si apre la pagina del lago in questione.

  3. Nella scheda Zone, fai clic sul nome della zona di dati da cui vuoi rimuovere il bucket Cloud Storage o il set di dati BigQuery. Viene visualizzata la pagina Zona dati relativa alla zona dati in questione.

  4. Nella scheda Asset, seleziona l'asset selezionando la casella a sinistra del nome dell'asset.

  5. Fai clic su Elimina risorsa.

  6. Nella finestra di dialogo di conferma, fai clic su Elimina.

REST

Per rimuovere un bucket, utilizza il metodo lakes.zones,assets.delete.

Passaggi successivi