Guida rapida: crea un lake

Questa pagina mostra come iniziare a utilizzare Dataplex nel nella console Google Cloud, guidandoti attraverso la creazione di un lake, l'aggiunta di una zona e allegando un asset.

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Nel campo Nuove entità, inserisci il tuo identificatore utente. In genere si tratta dell'indirizzo email di un Account Google.

    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni altro ruolo.
    7. Fai clic su Salva.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Make sure that billing is enabled for your Google Cloud project.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Vai a IAM
      2. Seleziona il progetto.
      3. Fai clic su Concedi l'accesso.
      4. Nel campo Nuove entità, inserisci il tuo identificatore utente. In genere si tratta dell'indirizzo email di un Account Google.

      5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
      6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni altro ruolo.
      7. Fai clic su Salva.
      8. Crea un bucket Cloud Storage:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Crea un lake

I passaggi riportati di seguito mostrano come creare un lake utilizzando la console Google Cloud.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Vai alla visualizzazione Gestisci.

  3. Fai clic su Crea.

  4. Inserisci un Nome visualizzato.

  5. L'ID lake viene generato automaticamente.

  6. Specifica la Regione in cui creare il lake.

    Per i lake creati in una determinata regione (ad esempio, us-central1), entrambi dati di una singola regione (us-central1) e dati di più regioni (us multi-region) può essere collegato a seconda delle impostazioni della zona.

  7. Fai clic su Crea.

aggiungi una zona al lake

Dopo averlo creato, puoi aggiungere zone al lake. Le zone sono raggruppamenti logici di dati non strutturati e strutturati.

  1. Nella vista Gestisci, fai clic sul nome del lake a cui vuoi aggiungere una zona.

  2. Fai clic su Aggiungi zona.

  3. Inserisci un Nome visualizzato per la zona.

  4. Fai clic sul menu a discesa Tipo. Scegli Zona non elaborata o Zona organizzata. Scopri di più sui tipi di zone.

  5. In Località dei dati, seleziona Regionale o Multiregionale. La scelta non può essere modificata in un secondo momento. Non è possibile combinare dati a livello di una singola regione e di più regioni nella stessa zona.

  6. Fai clic su Crea.

La creazione della zona potrebbe richiedere alcuni minuti.

Allega un asset

I dati possono essere archiviati nei bucket Cloud Storage o in BigQuery e possono essere collegati come asset alle zone dati all'interno di un lake Dataplex.

Segui questi passaggi per collegare il bucket Cloud Storage creato in precedenza come asset.

  1. Nella visualizzazione Gestisci, fai clic sul nome del lake a cui vuoi collegare un bucket Cloud Storage.

  2. Nella scheda Zone, fai clic sulla zona a cui aggiungere la risorsa.

  3. Nella scheda Asset, fai clic su . Aggiungi asset.

  4. Fai clic su Aggiungi un asset.

  5. In Tipo, seleziona Bucket di archiviazione.

  6. In Nome visualizzato, inserisci un nome per l'asset.

  7. Nel campo Bucket, fai clic su Sfoglia. Se disponi di un Cloud Storage individualo e fai clic su Seleziona. Se non hai un bucket Cloud Storage, puoi crearne uno facendo clic sul pulsante .

    1. Inserisci un nome univoco per il bucket. Fai clic su Continua.

    2. Scegli un Tipo di località. Fai clic su Continua.

    3. Scegli una classe di archiviazione predefinita per i tuoi dati. Fai clic su Continua.

    4. Scegli un livello di controllo dell'accesso. Fai clic su Continua.

    5. Scegli un'opzione di protezione dei dati oppure Nessuna. Fai clic su Continua.

    6. Fai clic su Crea.

    7. Fai clic su Seleziona

  8. Fai clic su Fine.

  9. Fai clic su Continua.

  10. In Impostazioni di rilevamento, seleziona Eredita per ereditare il rilevamento impostazioni dal a livello di zona.

  11. Fai clic su Continua.

  12. In Aggiungi asset, fai clic su Invia.

Attendi il completamento della creazione della risorsa.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi per le risorse utilizzate in questa pagina, segui questi passaggi.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

In alternativa, puoi eliminare le risorse utilizzate in questo tutorial. I lake non possono a meno che tutte le risorse delle zone dati sottostanti non siano state eliminate. Analogamente, le zone di dati non possono essere eliminate a meno che non siano state eliminate tutte le risorse degli asset al loro interno:

Scollega il bucket di archiviazione

I passaggi seguenti mostrano come scollegare l'asset Dataplex è stato creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul nome del lake che hai creato.

  3. Nella scheda Zone, fai clic sul nome della zona che hai creato.

  4. Nella scheda Asset, seleziona l'asset da scollegare selezionando la casella a sinistra del nome del bucket.

  5. Fai clic su Elimina asset.

  6. Fai clic su Elimina per confermare lo scollegamento.

Elimina la zona

I passaggi riportati di seguito mostrano come eliminare la zona Dataplex che hai creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul lake che hai creato.

  3. Nella scheda Zone, scegli la zona da eliminare selezionando la casella a sinistra del nome della zona dati.

  4. Fai clic su Elimina zona.

  5. Fai clic su Elimina per confermare l'eliminazione.

Elimina il lake

I passaggi seguenti mostrano come eliminare il lake Dataplex è stato creato.

  1. Vai a Dataplex nella console Google Cloud.

    Vai a Dataplex

  2. Nella visualizzazione Gestisci, fai clic sul lake che hai creato.

  3. Nella parte superiore della pagina, fai clic su Elimina.

  4. Conferma l'eliminazione digitando "delete" nella casella di testo.

  5. Fai clic su Elimina lago per confermare l'eliminazione.

Passaggi successivi

Dopo aver creato il lake, le zone e gli asset, puoi: