Preparare i dati con Gemini
Questo documento descrive come generare e gestire suggerimenti di codice SQL per le tue preparazioni dei dati in BigQuery.
Per ulteriori informazioni, consulta Introduzione alla preparazione dei dati di BigQuery.
Prima di iniziare
Apri l'editor di preparazione dei dati in BigQuery
Puoi aprire l'editor di preparazione dei dati in BigQuery creando una nuova preparazione dei dati, una da una tabella esistente o aprendo una preparazione dei dati esistente. Per saperne di più su cosa succede quando crei una preparazione dei dati, consulta Punti di contatto per la preparazione dei dati.
Nella pagina BigQuery Studio, puoi accedere all'editor di preparazione dei dati in modi diversi:
Crea nuovo
Per creare una nuova preparazione dei dati in BigQuery, segui questi passaggi:
- Nella console Google Cloud, vai alla pagina BigQuery Studio.
Vai a BigQuery - Vai all'elenco Crea nuovo e fai clic su Preparazione dei dati. L'editor di preparazione dei dati viene visualizzato in una nuova scheda di preparazione dei dati senza titolo.
- Nella barra di ricerca dell'editor, inserisci il nome della tabella o le parole chiave e
seleziona una tabella. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.
Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, a cui potrai accedere in futuro. - (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.
Crea nuovo dalla tabella
Per creare una nuova preparazione dei dati da una tabella esistente:
- Nella console Google Cloud, vai alla pagina BigQuery Studio.
Vai a BigQuery - Nel riquadro Explorer, tieni il puntatore del mouse sopra una tabella.
- Fai clic su more_vert
Menu > Query in > Preparazione dei dati. Si apre
l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei
dati nella scheda Dati e un insieme iniziale di suggerimenti di preparazione dei dati
di Gemini.
Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, a cui potrai accedere in futuro. - (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.
Apri esistente
Per aprire l'editor di una preparazione dei dati esistente:
- Nella console Google Cloud, vai alla pagina BigQuery Studio.
Vai a BigQuery - Nel riquadro Explorer, fai clic sul nome del progetto e su Preparazione dei dati.
- Seleziona la preparazione dei dati esistente. Viene visualizzata la visualizzazione del grafo della pipeline di preparazione dei dati.
- Seleziona uno dei nodi del grafico. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.
- (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.
Creare i passaggi di preparazione dei dati
Prepara i dati in più passaggi. Puoi visualizzare l'anteprima o applicare i passaggi suggeriti da Gemini. Puoi anche perfezionare i suggerimenti o applicare i tuoi passaggi. Per ulteriori informazioni sui passaggi di preparazione dei dati supportati, consulta Passaggi supportati.
Visualizzare, modificare e applicare i suggerimenti di Gemini
Quando apri l'editor di preparazione dei dati per la tabella nei passaggi precedenti, Gemini ispeziona i dati e lo schema della tabella che hai caricato e genera suggerimenti.
Quando visualizzi i dati nella visualizzazione dati, fai clic sul nome di una colonna o su una determinata cellula. Gemini genera suggerimenti di filtri e trasformazioni specifici per la colonna o la cella in questione.
Applica un suggerimento di Gemini come passaggio di preparazione dei dati:
- Nella visualizzazione dei dati, vai all'elenco Passaggi e rivedi i suggerimenti.
- (Facoltativo) Per visualizzare l'anteprima del risultato della scheda del suggerimento, fai clic su Anteprima.
(Facoltativo) Per modificare la scheda del suggerimento utilizzando il linguaggio naturale, fai clic su Modifica.
Per ulteriori informazioni sulla modifica dei suggerimenti, consulta Migliorare i suggerimenti con un esempio e Aggiungere passaggi con linguaggio naturale o espressioni SQL.
Fai clic su Applica.
Esplorare l'elenco di passaggi
Nella visualizzazione dei dati, puoi eseguire le seguenti azioni facendo clic su Passaggi applicati e controllando l'elenco dei passaggi:
- Modifica o rimuovi il passaggio nell'elenco facendo clic su more_vert Menu e apportando la modifica.
- Seleziona un passaggio nell'elenco per visualizzare il campione di dati e lo schema a partire da questo particolar passaggio.
- Seleziona un passaggio nell'elenco per inserire nuovi passaggi dopo quello selezionato.
Migliorare i suggerimenti con un esempio
Per perfezionare i suggerimenti di Gemini, fornisci un esempio di come dovrebbero essere i dati nella cella:
Nella visualizzazione dei dati, modifica i valori di una o tre celle per mostrare come devono essere i valori in quella colonna. Ad esempio, inserisci una data nel modo in cui vuoi formattare tutte le date. Gemini genera nuovi suggerimenti in base alle tue modifiche.
Per modificare una scheda di suggerimento, fai clic su Modifica.
Fai clic su Applica.
Aggiungere passaggi con linguaggio naturale o espressioni SQL
Se nessun suggerimento soddisfa le tue esigenze, aggiungine uno tuo facendo clic su Aggiungi passaggio, selezionando un tipo di passaggio e inserendo un prompt in linguaggio naturale che descriva la tua intenzione.
Aggiungi una trasformazione
- Nella visualizzazione dei dati, fai clic su Aggiungi passaggio e scegli l'opzione Trasformazione.
- Nel campo Descrizione, inserisci un prompt, ad esempio
Convert the state column to a uppercase
. Fai clic su Invia Invia.
Gemini genera un'espressione SQL e una nuova descrizione in base al tuo prompt.
Nell'elenco Colonna target, seleziona o inserisci il nome di una colonna.
(Facoltativo) Per aggiornare l'espressione SQL, rivedi il prompt e fai clic su invia Invia oppure inserisci manualmente un'espressione SQL.
(Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
Fai clic su Applica.
Filtra le righe
Per aggiungere un filtro che rimuove le righe:
- Nella visualizzazione dei dati, fai clic su Aggiungi passaggio > Filtra.
- Nel campo Descrizione, inserisci un prompt, ad esempio
Column ID should not be NULL
. - Fai clic su Genera. Gemini genera un'espressione SQL e una nuova descrizione in base al tuo prompt.
- (Facoltativo) Per aggiornare l'espressione SQL, rivedi il prompt e fai clic su send Invia oppure inserisci un'espressione SQL manualmente.
- (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
- Fai clic su Applica.
Formato dell'espressione di filtro
Le espressioni SQL per i filtri mantengono le righe che corrispondono alla condizione specificata. È equivalente a un'istruzione SELECT … WHERE SQL_EXPRESSION
.
Ad esempio, per conservare i record in cui la colonna year
è maggiore o uguale
a 2000
, la condizione è year >= 2000
.
Le espressioni devono rispettare la sintassi SQL di BigQuery per la
clausola WHERE
.
Configura la tabella degli errori e aggiungi una regola di convalida
Puoi aggiungere un filtro che crea una regola di convalida, che invia gli errori a una tabella degli errori o causa l'interruzione dell'esecuzione della preparazione dei dati.
Configurare la tabella degli errori
Per configurare la tabella degli errori:
- Nella visualizzazione dei dati, vai alla barra degli strumenti e fai clic su Altro > tabella degli errori.
- Fai clic su Attiva tabella degli errori.
- Definisci la posizione della tabella.
- (Facoltativo) Definisci una durata massima per la conservazione degli errori.
- Fai clic su Salva.
Aggiungere una regola di convalida
Per aggiungere una regola di convalida:
- Nella visualizzazione dei dati, fai clic su Aggiungi passaggio > Filtra.
- Inserisci una descrizione per il passaggio.
- Inserisci un'espressione SQL sotto forma di clausola
WHERE
. - (Facoltativo) Se vuoi che l'espressione SQL agisca come regola di convalida, seleziona la casella di controllo Le righe di convalida con errori vengono inviate alla tabella degli errori. Puoi anche cambiare un filtro in una convalida nella barra degli strumenti di preparazione dei dati facendo clic su Altro > Tabella degli errori.
- (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
- Fai clic su Applica.
Eliminare una colonna
Per eliminare una colonna da una preparazione dei dati:
- Nella visualizzazione dello schema, fai clic su more_vert Menu accanto alla colonna da eliminare.
- Fai clic su Elimina. Viene aggiunto un nuovo passaggio applicato per la colonna eliminata.
Aggiungere un'operazione di join con Gemini
Per aggiungere un passaggio di operazione di join tra due origini nella preparazione dei dati:
- Nella visualizzazione dei dati di un nodo nella preparazione dei dati, vai all'elenco Passaggi e fai clic su Aggiungi passaggio > Unione.
- Nella finestra di dialogo Aggiungi join, fai clic su Sfoglia e seleziona l'altra tabella coinvolta nell'operazione di join (indicata come lato destro del join).
- (Facoltativo) Seleziona il tipo di operazione di join da eseguire, ad esempio Unione interna.
Esamina le informazioni sulle chiavi di join generate da Gemini nei seguenti campi:
- Descrizione del join: la descrizione in linguaggio naturale dell'espressione SQL per l'operazione di join. Quando modifichi questa descrizione e fai clic su Invia Invia, Gemini suggerisce nuove condizioni di join SQL.
Condizioni di join: le espressioni SQL all'interno della clausola
ON
per l'operazione di join. Puoi utilizzare i qualificatoriL
eR
per fare riferimento rispettivamente alle tabelle di origine sinistra e destra. Ad esempio, per unire la colonnacustomer_id
della tabella a sinistra alla colonnacustomer_id
della tabella a destra, inserisciL.customerId = R.customerId
. Questi qualificatori non sono sensibili alle maiuscole.
(Facoltativo) Per perfezionare i suggerimenti di Gemini, modifica il campo Descrizione unione e poi fai clic su Invia Invia.
(Facoltativo) Per visualizzare l'anteprima delle impostazioni dell'operazione di join della preparazione dei dati, fai clic su Anteprima.
Fai clic su Applica.
Viene creato il passaggio dell'operazione di unione. La tabella di origine selezionata (lato destro della congiunzione) e l'operazione di congiunzione vengono riportate nell'elenco dei passaggi applicati e nei nodi nella visualizzazione del grafico della preparazione dei dati.
Aggiungere o modificare una tabella di destinazione
Per aggiungere o modificare una tabella di destinazione per l'output della preparazione dei dati:
- Nella visualizzazione dati, fai clic su Aggiungi > Destinazione.
- Seleziona il progetto in cui è archiviata la tabella di destinazione.
- Seleziona uno dei set di dati o caricane uno nuovo.
- Inserisci una tabella di destinazione. Se la tabella non esiste, la preparazione dei dati ne crea una nuova alla prima esecuzione. Per ulteriori informazioni, vedi Modalità di scrittura.
- Seleziona il set di dati di destinazione.
- Fai clic su Salva.
Esegui la preparazione dei dati
Dopo aver aggiunto i passaggi di preparazione dei dati, configurato la destinazione e corretto eventuali errori di convalida, puoi eseguire prove su un campione di dati o implementare i passaggi e pianificare le esecuzioni di preparazione dei dati. Per ulteriori informazioni, consulta Pianificare le preparazioni dei dati.
Aggiorna i campioni di preparazione dei dati
I dati nel campione non vengono aggiornati automaticamente. Se i dati nelle tabelle di origine per la preparazione dei dati sono cambiati, ma le modifiche non vengono applicate al campione di dati della preparazione, fai clic su Altro > Aggiorna campione.
Passaggi successivi
- Scopri come pianificare le preparazioni dei dati.
- Scopri di più sulla gestione delle preparazioni dei dati.
- Scopri di più su quote e limiti per Gemini in BigQuery.
- Esamina i prezzi di Gemini in BigQuery.