Preparare i dati con Gemini

Questo documento descrive come generare e gestire suggerimenti di codice SQL per le tue preparazioni dei dati in BigQuery.

Per ulteriori informazioni, consulta Introduzione alla preparazione dei dati di BigQuery.

Prima di iniziare

Apri l'editor di preparazione dei dati in BigQuery

Puoi aprire l'editor di preparazione dei dati in BigQuery creando una nuova preparazione dei dati, una da una tabella esistente o aprendo una preparazione dei dati esistente. Per saperne di più su cosa succede quando crei una preparazione dei dati, consulta Punti di contatto per la preparazione dei dati.

Nella pagina BigQuery Studio, puoi accedere all'editor di preparazione dei dati in modi diversi:

Crea nuovo

Per creare una nuova preparazione dei dati in BigQuery, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.
    Vai a BigQuery
  2. Vai all'elenco Crea nuovo e fai clic su Preparazione dei dati. L'editor di preparazione dei dati viene visualizzato in una nuova scheda di preparazione dei dati senza titolo.
  3. Nella barra di ricerca dell'editor, inserisci il nome della tabella o le parole chiave e seleziona una tabella. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.

    Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, a cui potrai accedere in futuro.
  4. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Crea nuovo dalla tabella

Per creare una nuova preparazione dei dati da una tabella esistente:

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.
    Vai a BigQuery
  2. Nel riquadro Explorer, tieni il puntatore del mouse sopra una tabella.
  3. Fai clic su more_vert Menu > Query in > Preparazione dei dati. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un insieme iniziale di suggerimenti di preparazione dei dati di Gemini.

    Nel riquadro Explorer viene visualizzata una risorsa Preparazione dei dati, a cui potrai accedere in futuro.
  4. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Apri esistente

Per aprire l'editor di una preparazione dei dati esistente:

  1. Nella console Google Cloud, vai alla pagina BigQuery Studio.
    Vai a BigQuery
  2. Nel riquadro Explorer, fai clic sul nome del progetto e su Preparazione dei dati.
  3. Seleziona la preparazione dei dati esistente. Viene visualizzata la visualizzazione del grafo della pipeline di preparazione dei dati.
  4. Seleziona uno dei nodi del grafico. Si apre l'editor di preparazione dei dati per la tabella, che mostra un'anteprima dei dati nella scheda Dati e un primo insieme di suggerimenti di preparazione dei dati di Gemini.
  5. (Facoltativo) Per semplificare la visualizzazione, attiva la modalità a schermo intero facendo clic su schermo intero Schermo intero.

Creare i passaggi di preparazione dei dati

Prepara i dati in più passaggi. Puoi visualizzare l'anteprima o applicare i passaggi suggeriti da Gemini. Puoi anche perfezionare i suggerimenti o applicare i tuoi passaggi. Per ulteriori informazioni sui passaggi di preparazione dei dati supportati, consulta Passaggi supportati.

Visualizzare e applicare i suggerimenti di Gemini

Quando apri l'editor di preparazione dei dati per la tabella nei passaggi precedenti, Gemini ispeziona i dati e lo schema della tabella che hai caricato e genera suggerimenti.

Quando visualizzi i dati nella visualizzazione dati, fai clic sul nome di una colonna o su una determinata cellula. Gemini genera suggerimenti di filtri e trasformazioni specifici per la colonna o la cella in questione.

Applica un suggerimento di Gemini come passaggio di preparazione dei dati:

  1. Nella visualizzazione dei dati, vai all'elenco Passaggi e rivedi i suggerimenti.
  2. (Facoltativo) Per modificare la descrizione o l'espressione SQL in una scheda di suggerimento, fai clic su Anteprima.
  3. Fai clic su Applica.
  4. (Facoltativo) Per ricevere suggerimenti migliori da Gemini, fornisci esempi e ripeti questi passaggi.

Nella visualizzazione dei dati, puoi eseguire le seguenti azioni facendo clic su Passaggi applicati e controllando l'elenco dei passaggi:

  • Per modificare o rimuovere un passaggio, fai clic su more_vert Menu e apporta la modifica.
  • Seleziona un passaggio nell'elenco per visualizzare il campione di dati e lo schema a partire da questo passaggio specifico.
  • Seleziona un passaggio nell'elenco per inserire nuovi passaggi dopo quello selezionato.

Migliorare i suggerimenti con un esempio

Per perfezionare i suggerimenti di Gemini, fornisci un esempio di come dovrebbero essere i dati nella cella:

  1. Nella visualizzazione dei dati, modifica i valori di una o tre celle per mostrare come devono essere i valori in quella colonna. Ad esempio, inserisci una data nel modo in cui vuoi formattare tutte le date. Gemini genera nuovi suggerimenti in base alle tue modifiche.

  2. Per modificare una scheda di suggerimento, fai clic su Anteprima.

  3. Fai clic su Applica.

Aggiungere manualmente i passaggi

Se nessuno dei suggerimenti soddisfa le tue esigenze, aggiungine uno tuo facendo clic su Aggiungi passaggio, selezionando un tipo di passaggio e inserendo una descrizione e un'espressione SQL.

Aggiungi una trasformazione

  1. Nella visualizzazione dei dati, seleziona una colonna e fai clic su Aggiungi passaggio > Trasformazione.
  2. Inserisci una descrizione per il passaggio.
  3. Inserisci un'espressione SQL.
  4. Nel campo Colonna target, seleziona una colonna o creane una nuova.
  5. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  6. Fai clic su Applica.

Filtra le righe

Per aggiungere un filtro che rimuove le righe:

  1. Nella visualizzazione dei dati, fai clic su Aggiungi passaggio > Filtra.
  2. Inserisci una descrizione per il passaggio.
  3. Inserisci un'espressione SQL.
  4. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  5. Fai clic su Applica.

Formato dell'espressione di filtro

Le espressioni SQL per i filtri mantengono le righe che corrispondono alla condizione specificata. Questo è equivalente a un'istruzione SELECT … WHERE SQL_EXPRESSION.

Ad esempio, per conservare i record in cui la colonna year è maggiore o uguale a 2000, la condizione è year >= 2000.

Le espressioni devono rispettare la sintassi SQL di BigQuery per la clausola WHERE.

Configura la tabella degli errori e aggiungi una regola di convalida

Puoi aggiungere un filtro che crea una regola di convalida, che invia gli errori a una tabella degli errori o causa l'interruzione dell'esecuzione della preparazione dei dati.

Configurare la tabella degli errori

Per configurare la tabella degli errori:

  1. Nella visualizzazione dei dati, vai alla barra degli strumenti e fai clic su Altro > tabella degli errori.
  2. Fai clic su Attiva tabella degli errori.
  3. Definisci la posizione della tabella.
  4. (Facoltativo) Definisci una durata massima per la conservazione degli errori.
  5. Fai clic su Salva.

Aggiungere una regola di convalida

Per aggiungere una regola di convalida:

  1. Nella visualizzazione dei dati, fai clic su Aggiungi passaggio > Filtra.
  2. Inserisci una descrizione per il passaggio.
  3. Inserisci un'espressione SQL sotto forma di clausola WHERE.
  4. (Facoltativo) Se vuoi che l'espressione SQL agisca come regola di convalida, seleziona la casella di controllo Le righe di convalida con errori vengono inviate alla tabella degli errori. Puoi anche cambiare un filtro in una convalida nella barra degli strumenti di preparazione dei dati facendo clic su Altro > Tabella degli errori.
  5. (Facoltativo) Fai clic su Anteprima ed esamina il passaggio.
  6. Fai clic su Applica.

Eliminare una colonna

Per eliminare una colonna da una preparazione dei dati:

  1. Nella visualizzazione dello schema, fai clic su more_vert Menu accanto alla colonna da eliminare.
  2. Fai clic su Elimina. Viene aggiunto un nuovo passaggio applicato per la colonna eliminata.

Aggiungere un'operazione di join

Per aggiungere un passaggio di operazione di join tra due origini nella preparazione dei dati:

  1. Nella visualizzazione dei dati di un nodo nella preparazione dei dati, vai all'elenco Passaggi e fai clic su Aggiungi passaggio > Unione.
  2. Nella finestra di dialogo Configura unione, seleziona l'altra tabella coinvolta nell'operazione di unione (indicata come lato destro dell'unione).
  3. (Facoltativo) Seleziona le chiavi di join per ogni tabella. Le chiavi di join devono avere lo stesso tipo di dati.
  4. (Facoltativo) Seleziona il tipo di operazione di join da eseguire, ad esempio Unione interna.
  5. (Facoltativo) Per preparare la tabella a destra prima di specificare una chiave di join, ad esempio quando i tipi di dati delle due colonne nella join sono diversi, segui questi passaggi:

    1. Salvare un join senza una chiave di join selezionata.
    2. Vai alla visualizzazione del grafico e seleziona la tabella di origine a destra.
    3. Prepara la tabella a destra, ad esempio trasformando il tipo di dati di una colonna.
    4. Modifica l'unione salvata nel passaggio precedente impostando una chiave.
  6. Fai clic su Crea.

Tutte le righe della tabella vengono conservate, anche se non è presente un valore corrispondente in una delle tabelle.

Dopo aver salvato il passaggio, la tabella di origine selezionata (il lato destro del join) e l'operazione di join vengono riportate nell'elenco dei passaggi applicati e nei nodi della visualizzazione del grafico della preparazione dei dati.

Aggiungere o modificare una tabella di destinazione

Per aggiungere o modificare una tabella di destinazione per l'output della preparazione dei dati:

  1. Nella visualizzazione dati, fai clic su Aggiungi > Destinazione.
  2. Seleziona il progetto in cui è archiviata la tabella di destinazione.
  3. Seleziona uno dei set di dati o caricane uno nuovo.
  4. Inserisci una tabella di destinazione. Se la tabella non esiste, la preparazione dei dati ne crea una nuova alla prima esecuzione. Per ulteriori informazioni, vedi Modalità di scrittura.
  5. Seleziona il set di dati di destinazione.
  6. Fai clic su Salva.

Esegui la preparazione dei dati

Per eseguire i passaggi di preparazione dei dati e caricare i dati preparati nella tabella di destinazione, pianifica un'esecuzione di preparazione dei dati una tantum o ricorrente:

  1. Salva eventuali modifiche in sospeso nella preparazione dei dati.
  2. Nella barra degli strumenti di preparazione dei dati, fai clic su Pianifica.
  3. Inserisci un nome per la pianificazione.
  4. Inserisci il nome dell'account di servizio associato all'esecuzione.
  5. Imposta una frequenza.
  6. Fai clic su Crea programmazione.

Per saperne di più, consulta Pianificare le preparazioni dei dati.

Aggiornare i campioni di preparazione dei dati

I dati nel campione non vengono aggiornati automaticamente. Se i dati nelle tabelle di origine per la preparazione dei dati sono cambiati, ma le modifiche non vengono applicate al campione di dati della preparazione, fai clic su Altro > Aggiorna campione.

Passaggi successivi