Guida rapida: crea un lake

Questa pagina mostra come iniziare a utilizzare Dataplex nella console Google Cloud, illustrandoti come creare un lake, aggiungere una zona e collegare un asset.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. Abilita le API Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery e Cloud Storage .

    Abilita le API

  5. Assicurati di disporre dei seguenti ruoli nel progetto: roles/dataplex.admin, roles/dataplex.editor

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Nella colonna Entità, individua la riga contenente il tuo indirizzo email.

      Se il tuo indirizzo email non è in questa colonna, significa che non disponi di alcun ruolo.

    4. Nella colonna Ruolo per la riga contenente il tuo indirizzo email, controlla se l'elenco dei ruoli include quelli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Nel campo Nuove entità, inserisci il tuo indirizzo email.
    5. Nell'elenco Seleziona un ruolo, scegli un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ciascun ruolo aggiuntivo.
    7. Fai clic su Salva.
  6. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  7. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  8. Abilita le API Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery e Cloud Storage .

    Abilita le API

  9. Assicurati di disporre dei seguenti ruoli nel progetto: roles/dataplex.admin, roles/dataplex.editor

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Nella colonna Entità, individua la riga contenente il tuo indirizzo email.

      Se il tuo indirizzo email non è in questa colonna, significa che non disponi di alcun ruolo.

    4. Nella colonna Ruolo per la riga contenente il tuo indirizzo email, controlla se l'elenco dei ruoli include quelli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Nel campo Nuove entità, inserisci il tuo indirizzo email.
    5. Nell'elenco Seleziona un ruolo, scegli un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ciascun ruolo aggiuntivo.
    7. Fai clic su Salva.
  10. Crea un bucket Cloud Storage:
    1. Nella console Google Cloud, vai alla pagina Bucket di Cloud Storage.

      Vai alla pagina Bucket

    2. Fai clic su Crea bucket.
    3. Nella pagina Crea un bucket, inserisci le informazioni del bucket. Per andare al passaggio successivo, fai clic su Continua.
      • In Assegna un nome al bucket, inserisci un nome univoco per il bucket. Non includere informazioni sensibili nel nome del bucket, poiché lo spazio dei nomi dei bucket è globale e visibile pubblicamente.
      • Per Scegli dove archiviare i tuoi dati, segui questi passaggi:
        • Seleziona un'opzione Tipo di località.
        • Seleziona un'opzione Località.
      • Per Scegli una classe di archiviazione predefinita per i dati, seleziona quanto segue: Standard.
      • Per Scegli come controllare l'accesso agli oggetti, seleziona un'opzione Controllo dell'accesso.
      • In Impostazioni avanzate (facoltative), specifica un metodo di crittografia, un criterio di conservazione o le etichette dei bucket.
    4. Fai clic su Crea.

Crea un lake

I passaggi seguenti mostrano come creare un lake utilizzando la console Google Cloud.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Vai alla visualizzazione Gestisci.

  3. Fai clic su Crea.

  4. Inserisci un Nome visualizzato.

  5. L'ID lake viene generato automaticamente.

  6. Specifica la Regione in cui creare il lake.

    Per i lake creati in una determinata regione (ad esempio us-central1), è possibile collegare sia i dati di una singola regione (us-central1) sia quelli di più regioni (us multi-region), a seconda delle impostazioni della zona.

  7. Fai clic su Crea.

Aggiungi una zona al lake

Dopo aver creato il lake, puoi aggiungerne altre. Le zone sono raggruppamenti logici di dati non strutturati e strutturati.

  1. Nella vista Gestisci, fai clic sul nome del lake a cui vuoi aggiungere una zona.

  2. Fai clic su Aggiungi zona.

  3. Inserisci un Nome visualizzato per la zona.

  4. Fai clic sul menu a discesa Tipo. Scegli Zona non elaborata o Zona curata. Scopri di più sui tipi di zone.

  5. In Località dei dati, seleziona A livello di regione o Più regioni. I dati scelti non possono essere modificati in un secondo momento. Non è possibile combinare dati a una o più regioni nella stessa zona.

  6. Fai clic su Crea.

La creazione della zona potrebbe richiedere alcuni minuti.

Allega un asset

I dati possono essere archiviati nei bucket Cloud Storage o nei set di dati BigQuery e possono essere associati come risorse a zone dati all'interno di un lake Dataplex.

Segui questi passaggi per collegare il bucket Cloud Storage creato in precedenza come asset.

  1. Nella visualizzazione Gestisci, fai clic sul nome del lake a cui vuoi associare un bucket Cloud Storage.

  2. Nella scheda Zone, fai clic sulla zona a cui aggiungere l'asset.

  3. Nella scheda Asset, fai clic su Aggiungi asset.

  4. Fai clic su Aggiungi un asset.

  5. In Tipo, seleziona Bucket di archiviazione.

  6. In Nome visualizzato, inserisci un nome per l'asset.

  7. Nel campo Bucket, fai clic su Sfoglia. Se hai un bucket Cloud Storage, trovalo e fai clic su Seleziona. Se non hai un bucket Cloud Storage, puoi crearne uno facendo clic sul pulsante .

    1. Inserisci un nome univoco per il bucket. Fai clic su Continua.

    2. Scegli un Tipo di località. Fai clic su Continua.

    3. Scegli una classe di archiviazione predefinita per i tuoi dati. Fai clic su Continua.

    4. Scegli un livello di controllo dell'accesso. Fai clic su Continua.

    5. Scegli un'opzione di protezione dei dati o Nessuna. Fai clic su Continua.

    6. Fai clic su Crea.

    7. Fai clic su Seleziona.

  8. Fai clic su Fine.

  9. Fai clic su Continua.

  10. In Impostazioni di rilevamento, seleziona Eredita per ereditare le impostazioni di rilevamento dal livello di zona.

  11. Fai clic su Continua.

  12. In Aggiungi asset, fai clic su Invia.

Attendi il completamento della creazione dell'asset.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

  1. Nella console Google Cloud, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Se il progetto che vuoi eliminare è associato a un'organizzazione, espandi l'elenco Organizzazione nella colonna Nome.
  3. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  4. Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.

In alternativa, puoi eliminare le risorse utilizzate in questo tutorial. I lake non possono essere eliminati a meno che non siano state eliminate tutte le risorse della zona dati sottostanti. Analogamente, le zone dati non possono essere eliminate a meno che non siano state eliminate tutte le risorse di asset al di sotto:

Scollega il bucket di archiviazione

I passaggi seguenti mostrano come scollegare l'asset Dataplex che hai creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul nome del lake che hai creato.

  3. Nella scheda Zone, fai clic sul nome della zona creata.

  4. Nella scheda Asset, scegli l'asset da scollegare selezionando la casella a sinistra del nome del bucket.

  5. Fai clic su Elimina asset.

  6. Fai clic su Elimina per confermare lo scollegamento.

Elimina la zona

I passaggi seguenti mostrano come eliminare la zona Dataplex che hai creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella vista Gestisci, fai clic sul lake che hai creato.

  3. Nella scheda Zone, scegli la zona da eliminare selezionando la casella a sinistra del nome della zona dati.

  4. Fai clic su Elimina zona.

  5. Fai clic su Elimina per confermare l'eliminazione.

Elimina il lake

I passaggi seguenti mostrano come eliminare il lake Dataplex che hai creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella vista Gestisci, fai clic sul lake che hai creato.

  3. Nella parte superiore della pagina, fai clic su Elimina.

  4. Conferma l'eliminazione digitando "delete" nella casella di testo.

  5. Fai clic su Elimina lake per confermare l'eliminazione.

Passaggi successivi

Dopo aver creato lake, zone e asset, puoi: