Guida rapida: crea un lake

Questo documento ti mostra come iniziare a utilizzare Dataplex nella console Google Cloud, illustrando la creazione di un lake, l'aggiunta di una zona e il collegamento di un asset.

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi accesso.
    4. Nel campo Nuove entità, inserisci il tuo identificatore utente. In genere si tratta dell'indirizzo email di un Account Google.

    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
    7. Fai clic su Salva.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Make sure that billing is enabled for your Google Cloud project.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Vai a IAM
      2. Seleziona il progetto.
      3. Fai clic su Concedi accesso.
      4. Nel campo Nuove entità, inserisci il tuo identificatore utente. In genere si tratta dell'indirizzo email di un Account Google.

      5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
      6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
      7. Fai clic su Salva.
      8. Crea un bucket Cloud Storage:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Crea un lake

Un lake è un costrutto logico che rappresenta un dominio dati o un'unità aziendale. Ad esempio, se devi organizzare i dati in base all'utilizzo del gruppo, devi creare un lake per ogni reparto (ad esempio, vendita al dettaglio, vendite e finanza).

I passaggi riportati di seguito mostrano come creare un lake utilizzando la console Google Cloud.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Vai alla visualizzazione Gestisci.

  3. Fai clic su Crea.

  4. Inserisci un Nome visualizzato.

  5. L'ID lago viene generato automaticamente.

  6. Specifica la Regione in cui creare il lake.

    Per i lake creati in una determinata regione (ad esempio us-central1), è possibile associare i dati sia a singola regione (us-central1) che a più regioni (us multi-region) a seconda delle impostazioni della zona.

  7. Fai clic su Crea.

aggiungi una zona al lake

Dopo averlo creato, puoi aggiungere zone al lake. Le zone sono raggruppamenti logici all'interno di un lake, utili per classificare i dati strutturati e non strutturati.

  1. Nella visualizzazione Gestisci, fai clic sul nome del lago a cui vuoi aggiungere una zona.

  2. Fai clic su Aggiungi zona.

  3. Inserisci un nome visualizzato per la zona.

  4. Fai clic sul menu a discesa Tipo. Scegli Zona non elaborata o Zona organizzata. Scopri di più sui tipi di zone.

  5. In Località dei dati, seleziona Regionale o Multiregionale. La scelta non può essere modificata in un secondo momento. Non è possibile combinare dati a livello di una singola regione e di più regioni nella stessa zona.

  6. Fai clic su Crea.

La creazione della zona potrebbe richiedere alcuni minuti.

Collega un asset

I dati possono essere archiviati nei bucket Cloud Storage o nei set di dati BigQuery e possono essere collegati come asset alle zone di dati all'interno di un lake Dataplex.

Per collegare il bucket Cloud Storage come risorsa:

  1. Nella visualizzazione Gestisci, fai clic sul nome del lake a cui vuoi collegare un bucket Cloud Storage.

  2. Nella scheda Zone, fai clic sulla zona a cui aggiungere la risorsa.

  3. Nella scheda Asset, fai clic su Aggiungi asset.

  4. Fai clic su Aggiungi un asset.

  5. In Tipo, seleziona Bucket di archiviazione.

  6. In Nome visualizzato, inserisci un nome per l'asset.

  7. Nel campo Bucket, fai clic su Sfoglia. Se hai un bucket Cloud Storage, individualo e fai clic su Seleziona. Se non hai un bucket Cloud Storage, puoi crearne uno facendo clic sul pulsante .

    1. Inserisci un nome univoco per il bucket. Fai clic su Continua.

    2. Scegli un Tipo di località. Fai clic su Continua.

    3. Scegli una classe di archiviazione predefinita per i tuoi dati. Fai clic su Continua.

    4. Scegli un livello di controllo dell'accesso. Fai clic su Continua.

    5. Scegli un'opzione di protezione dei dati o Nessuna. Fai clic su Continua.

    6. Fai clic su Crea.

    7. Fai clic su Seleziona

  8. Fai clic su Fine.

  9. Fai clic su Continua.

  10. In Impostazioni di rilevamento, seleziona Eredita per ereditare le impostazioni di rilevamento dal livello di zona.

  11. Fai clic su Continua.

  12. In Aggiungi asset, fai clic su Invia.

Attendi il completamento della creazione della risorsa.

Per utilizzare il lake, consulta la sezione Passaggi successivi. In caso contrario, elimina le risorse che hai creato seguendo i passaggi descritti nella sezione Pulizia.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

In alternativa, puoi eliminare le risorse utilizzate in questo tutorial. Un lake non viene eliminato finché non elimini tutte le risorse della relativa zona di dati. Analogamente, una zona di dati non viene eliminata a meno che non elimini tutte le risorse delle risorse.

Scollega il bucket di archiviazione

Per scollegare l'asset Dataplex che hai creato:

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul nome del lake che hai creato.

  3. Nella scheda Zone, fai clic sul nome della zona che hai creato.

  4. Nella scheda Asset, seleziona l'asset da scollegare selezionando la casella a sinistra del nome del bucket.

  5. Fai clic su Elimina risorsa.

  6. Fai clic su Elimina per confermare lo scollegamento.

Elimina la zona

Per eliminare la zona Dataplex che hai creato:

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul lake che hai creato.

  3. Nella scheda Zone, seleziona la zona da eliminare selezionando la casella a sinistra del nome della zona di dati.

  4. Fai clic su Elimina zona.

  5. Fai clic su Elimina per confermare l'eliminazione.

Elimina il lake

I passaggi riportati di seguito mostrano come eliminare il lake Dataplex che hai creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul lake che hai creato.

  3. Nella parte superiore della pagina, fai clic su Elimina.

  4. Conferma l'eliminazione digitando "delete" nel campo.

  5. Fai clic su Elimina lago per confermare l'eliminazione.

Passaggi successivi