Gestire la preparazione dei dati
Questo documento descrive come gestire le preparazioni dei dati in BigQuery, inclusa la loro implementazione e pianificazione. Le preparazioni dei dati sono risorse di BigQuery basate su Dataform.
Prima di iniziare
- Assicurati di aver attivato l'API Gemini in BigQuery.
Ruoli obbligatori
Per assicurarti che l'account di servizio Dataform disponga delle autorizzazioni necessarie per preparare i dati in BigQuery, consulta i ruoli richiesti per gli account di servizio Dataform.
Per ottenere le autorizzazioni necessarie per preparare i dati in BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
-
Editor dati BigQuery (
roles/bigquery.dataEditor
) -
Consumatore di utilizzo del servizio (
roles/serviceusage.serviceUsageConsumer
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Visualizzare le preparazioni dei dati esistenti
Per visualizzare un elenco delle preparazioni dei dati esistenti:
- Nella pagina BigQuery Studio, vai al riquadro Explorer.
- Espandi il progetto.
- Espandi l'elenco Preparazione dei dati.
Pianifica le preparazioni dei dati
Puoi creare pianificazioni nell'editor di preparazione dei dati e gestirle nella pagina Orchestration di BigQuery.
Crea una pianificazione
Per creare una pianificazione che esegua i passaggi di preparazione dei dati e carichi i dati preparati nella tabella di destinazione, pianifica un'esecuzione di preparazione dei dati una tantum o ricorrente:
- Nella barra degli strumenti di preparazione dei dati, fai clic su Pianifica.
- Inserisci un nome per la pianificazione.
- Inserisci il nome dell'account di servizio associato all'esecuzione.
- Pianifica una frequenza.
- Fai clic su Crea programmazione.
Visualizza pianificazioni
Per visualizzare tutte le pianificazioni di preparazione dei dati nel progetto:
Nella console Google Cloud, vai alla pagina Orchestration.
(Facoltativo) Per visualizzare i dettagli di una pianificazione selezionata e delle relative esecuzioni passate, fai clic sul nome della pianificazione.
Elimina una pianificazione
Per eliminare definitivamente una pianificazione per una preparazione dei dati selezionata:
Nella console Google Cloud, vai alla pagina Orchestration.
Nella riga contenente la pianificazione, fai clic su > Elimina.
Azioni
Ottimizza la preparazione dei dati elaborandoli in modo incrementale
Per configurare il modo in cui i dati preparati vengono scritti in una tabella di destinazione, segui questi passaggi.
Nella console Google Cloud, vai alla pagina BigQuery Studio.
Nel riquadro Attività, seleziona la preparazione dei dati.
Nella barra degli strumenti della preparazione dei dati, seleziona Altro > Modalità scrittura.
Seleziona una delle opzioni. Per ulteriori informazioni, vedi Modalità di scrittura.
Fai clic su Salva.
Contribuisci a migliorare i suggerimenti
Puoi contribuire a migliorare i suggerimenti di Gemini condividendo con Google i dati dei prompt che invii alle funzionalità in Anteprima. Per condividere i dati dei prompt, segui questi passaggi:
- Apri l'editor di preparazione dei dati in BigQuery.
- Nella barra degli strumenti di preparazione dei dati, fai clic su Impostazioni Altro.
- Seleziona Condividi i dati per migliorare Gemini in BigQuery.
Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable
e serviceusage.services.list
. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, consulta
Gemini per il programma Trusted Tester di Google Cloud.
Versioni di preparazione dei dati
Le preparazioni dei dati di BigQuery non supportano la visualizzazione, il confronto o il recupero delle versioni delle preparazioni dei dati.
Per un elenco delle versioni di preparazione dei dati in ordine cronologico:
- Nella pagina BigQuery Studio, vai al riquadro Explorer.
- Seleziona la preparazione dei dati. Le versioni sono elencate nella scheda Attività nel riquadro Explorer.
Scaricare una preparazione dei dati
Per scaricare una preparazione dei dati in un file YAML:
Nella console Google Cloud, vai alla pagina BigQuery Studio.
Nel riquadro Explorer, espandi il progetto e la cartella Preparazione dei dati. Fai clic sul nome della preparazione dei dati da scaricare.
Fai clic su Scarica. La preparazione dei dati viene salvata nel formato del file YAML, ad esempio
NAME data preparation.dp.yaml
.
Carica una preparazione dei dati
Per caricare una preparazione dei dati da un file YAML:
Nella console Google Cloud, vai alla pagina BigQuery Studio.
Nel riquadro Explorer, espandi il progetto.
Vai alla cartella Preparazione dei dati e fai clic su more_vert Menu > Carica in Preparazione dei dati.
Nella finestra di dialogo Carica preparazione dei dati, seleziona un file da caricare o inserisci l'URL della preparazione dei dati.
Inserisci un nome per la preparazione dei dati.
Seleziona una posizione di preparazione dei dati in cui vengono gestite e archiviate le risorse.
Fai clic su Carica.
Passaggi successivi
- Scopri di più sulla preparazione dei dati in BigQuery.
- Scopri come creare preparazioni dei dati.