Gestire la preparazione dei dati

Questo documento descrive come gestire le preparazioni dei dati in BigQuery, inclusa la loro implementazione e pianificazione. Le preparazioni dei dati sono risorse di BigQuery basate su Dataform.

Prima di iniziare

Ruoli obbligatori

Per assicurarti che l'account di servizio Dataform disponga delle autorizzazioni necessarie per preparare i dati in BigQuery, consulta i ruoli richiesti per gli account di servizio Dataform.

Per ottenere le autorizzazioni necessarie per preparare i dati in BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Visualizzare le preparazioni dei dati esistenti

Per visualizzare un elenco delle preparazioni dei dati esistenti:

  1. Nella pagina BigQuery Studio, vai al riquadro Explorer.
  2. Espandi il progetto.
  3. Espandi l'elenco Preparazioni dei dati.

Pianificare le preparazioni dei dati

Puoi creare pianificazioni nell'editor di preparazione dei dati e gestirle nella pagina Orchestration di BigQuery.

Crea una pianificazione

Per creare una pianificazione che esegua i passaggi di preparazione dei dati e carichi i dati preparati nella tabella di destinazione, pianifica un'esecuzione singola o ricorrente della preparazione dei dati:

  1. Nella barra degli strumenti di preparazione dei dati, fai clic su Pianifica.
  2. Inserisci un nome per la pianificazione.
  3. Inserisci il nome dell'account di servizio associato all'esecuzione.
  4. Pianifica una frequenza.
  5. Fai clic su Crea programmazione.

Visualizza pianificazioni

Per visualizzare tutte le pianificazioni di preparazione dei dati nel progetto:

  1. Nella console Google Cloud, vai alla pagina Orchestration.

    Vai a Orchestrazione

  2. (Facoltativo) Per visualizzare i dettagli di una pianificazione selezionata e delle relative esecuzioni passate, fai clic sul nome della pianificazione.

Elimina una pianificazione

Per eliminare definitivamente una pianificazione per una preparazione dei dati selezionata:

  1. Nella console Google Cloud, vai alla pagina Orchestration.

    Vai a Orchestrazione

  2. Nella riga contenente la pianificazione, fai clic su Azioni > Elimina.

Ottimizza la preparazione dei dati elaborandoli in modo incrementale

Per configurare il modo in cui i dati preparati vengono scritti in una tabella di destinazione, segui questi passaggi.

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.

    Vai a BigQuery

  2. Nel riquadro Attività, seleziona la preparazione dei dati.

  3. Nella barra degli strumenti della preparazione dei dati, seleziona Altro > Modalità scrittura.

  4. Seleziona una delle opzioni. Per ulteriori informazioni, vedi Modalità di scrittura.

  5. Fai clic su Salva.

Contribuisci a migliorare i suggerimenti

Puoi contribuire a migliorare i suggerimenti di Gemini condividendo con Google i dati dei prompt che invii alle funzionalità in Anteprima. Per condividere i dati dei prompt, segui questi passaggi:

  1. Apri l'editor di preparazione dei dati in BigQuery.
  2. Nella barra degli strumenti di preparazione dei dati, fai clic su Impostazioni Altro.
  3. Seleziona Condividi i dati per migliorare Gemini in BigQuery.

Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable e serviceusage.services.list. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, consulta Gemini per il programma Trusted Tester di Google Cloud.

Versioni di preparazione dei dati

Le preparazioni dei dati di BigQuery non supportano la visualizzazione, il confronto o il recupero delle versioni di preparazione dei dati.

Per un elenco delle versioni di preparazione dei dati in ordine cronologico:

  1. Nella pagina BigQuery Studio, vai al riquadro Explorer.
  2. Seleziona la preparazione dei dati. Le versioni sono elencate nella scheda Attività nel riquadro Explorer.

Scaricare una preparazione dei dati

Per scaricare una preparazione dei dati in un file YAML:

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Preparazione dei dati. Fai clic sul nome della preparazione dei dati da scaricare.

  3. Fai clic su Scarica. La preparazione dei dati viene salvata nel formato del file YAML, ad esempio NAME data preparation.dp.yaml.

Carica una preparazione dei dati

Per caricare una preparazione dei dati da un file YAML:

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto.

  3. Vai alla cartella Preparazione dei dati e fai clic su more_vert Menu > Carica in Preparazione dei dati.

  4. Nella finestra di dialogo Carica preparazione dei dati, seleziona un file da caricare o inserisci l'URL della preparazione dei dati.

  5. Inserisci un nome per la preparazione dei dati.

  6. Seleziona una posizione di preparazione dei dati in cui vengono gestite e archiviate le risorse.

  7. Fai clic su Carica.

Passaggi successivi