Eseguire analisi con il canvas di dati BigQuery

Il canvas di dati di BigQuery Studio, che è una funzionalità di Gemini in BigQuery, consente di trovare, trasformare, sottoporre a query e visualizzare i dati utilizzando prompt in linguaggio naturale e un'interfaccia grafica per i flussi di lavoro di analisi.

Per i flussi di lavoro di analisi, il data canvas BigQuery utilizza un grafo aciclico diretto (DAG), che fornisce una visualizzazione grafica del flusso di lavoro. Nel canvas di dati di BigQuery, puoi eseguire l'iterazione sui risultati delle query e lavorare con più branche di indagine in un unico posto.

Il canvas di dati BigQuery è progettato per accelerare le attività di analisi e aiutare professionisti dei dati come data analyst, data engineer e altri nel loro percorso dalla raccolta dei dati all'estrazione di informazioni. Non è richiesta alcuna conoscenza tecnica di strumenti specifici, ma solo una conoscenza di base della lettura e della scrittura di SQL. Il canvas di dati di BigQuery funziona con i metadati di Dataplex per identificare le tabelle appropriate in base al linguaggio naturale.

Il canvas di dati di BigQuery non è destinato all'uso diretto da parte degli utenti aziendali.

Il canvas di dati BigQuery utilizza Gemini in BigQuery per trovare i dati, creare SQL, generare grafici e creare riepiloghi dei dati.

Scopri come e quando Gemini for Google Cloud utilizza i tuoi dati.

Funzionalità

Il canvas di dati BigQuery ti consente di:

  • Utilizza query in linguaggio naturale o sintassi di ricerca delle parole chiave con i metadati di Dataplex per trovare asset come tabelle, viste o viste materializzate.

  • Utilizza il linguaggio naturale per le query SQL di base, ad esempio le seguenti:

    • Query che contengono clausole FROM, funzioni matematiche, array e strutture.
    • Operazioni JOIN per due tabelle.
  • Visualizza i dati utilizzando i seguenti tipi di grafici:

    • Grafico a barre
    • Mappa termica
    • Grafico lineare
    • Grafico a torta
    • Grafico a dispersione
  • Crea visualizzazioni personalizzate utilizzando il linguaggio naturale per descrivere ciò che vuoi.

  • Automatizza gli approfondimenti sui dati.

Limitazioni

  • I comandi di linguaggio naturale potrebbero non funzionare bene con quanto segue:

    • BigQuery ML
    • Apache Spark
    • Tabelle di oggetti
    • BigLake
    • INFORMATION_SCHEMA visualizzazioni
    • JSON
    • Campi nidificati e ripetuti
    • Funzioni e tipi di dati complessi come DATETIME e TIMEZONE
  • Le visualizzazioni dei dati non funzionano con i grafici delle mappe geografiche.

Best practice per i prompt

Con le tecniche di prompt giuste, puoi generare query SQL complesse. I seguenti suggerimenti aiutano il canvas di dati di BigQuery a perfezionare i prompt in linguaggio naturale per aumentare l'accuratezza delle query:

  • Scrivi con chiarezza. Formula la tua richiesta in modo chiaro ed evita di essere vago.

  • Poni domande dirette. Per la risposta più precisa, fai una domanda alla volta e mantieni i prompt concisi. Se necessario, separa i prompt in diversi nodi nel canvas di dati BigQuery.

  • Fornisci istruzioni chiare e specifiche. Metti in evidenza i termini chiave nei prompt.

  • Specifica l'ordine delle operazioni. Fornisci istruzioni in modo chiaro e ordinato. Suddividi le attività in piccoli passaggi mirati.

  • Perfeziona e esegui l'iterazione. Prova frasi e approcci diversi per vedere cosa dà i risultati migliori.

Per ulteriori informazioni, consulta Best practice per i prompt per il canvas di dati di BigQuery.

Prima di iniziare

  1. Assicurati che Gemini in BigQuery sia abilitato per il tuo progetto Google Cloud. In genere, questo passaggio viene eseguito da un amministratore.
  2. Assicurati di disporre delle autorizzazioni IAM (Identity and Access Management) necessarie per utilizzare il data canvas di BigQuery.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per utilizzare il data canvas di BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Introduzione a IAM.

Utilizzare il canvas di dati di BigQuery

Puoi utilizzare il canvas di dati BigQuery nella console Google Cloud, in una query o in una tabella.

  1. Vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuova e poi su Canvas di dati.

    Icona Crea canvas di dati.

  3. Nel campo del prompt Lingua naturale, inserisci un prompt in linguaggio naturale.

    Ad esempio, se inserisci Find me tables related to trees, il canvas di dati BigQuery restituisce un elenco di possibili tabelle, inclusi set di dati pubblici come bigquery-public-data.usfs_fia.plot_tree o bigquery-public-data.new_york_trees.tree_species.

  4. Seleziona una tabella.

    Al canvas dei dati BigQuery viene aggiunto un nodo tabella per la tabella selezionata. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

Provare flussi di lavoro di esempio

Questa sezione illustra diversi modi per utilizzare il canvas di dati BigQuery nei flussi di lavoro di analisi.

Flusso di lavoro di esempio: trovare, eseguire query e visualizzare i dati

In questo esempio, utilizzi i prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare dati, generare una query e modificarla. Poi, crea un grafico.

Prompt 1: trova i dati

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuova e poi su Canvas di dati.

    Icona Crea canvas di dati.

  3. Nel campo del prompt Lingua naturale, inserisci il seguente prompt in linguaggio naturale:

    Chicago taxi trips
    

    Il canvas di dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex. Puoi selezionare più tabelle.

  4. Seleziona la tabella bigquery-public-data.chicago_taxi_trips.taxi_trips, quindi fai clic su Aggiungi al riquadro.

    Al canvas di dati BigQuery viene aggiunto un nodo tabella per taxi_trips. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

Prompt 2: genera una query SQL nella tabella selezionata

Per generare una query SQL per la tabellabigquery-public-data.chicago_taxi_trips.taxi_trips, segui questi passaggi:

  1. Nel riquadro dei dati, fai clic su Query.

  2. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips
    

    Il data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Prompt 3: modifica la query

Per modificare la query generata, puoi modificarla manualmente o cambiare il prompt in linguaggio naturale e rigenerare la query. In questo esempio, utilizzi un prompt in linguaggio naturale per modificare la query in modo da selezionare solo le corse in cui il cliente ha pagato in contanti.

  1. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips where the payment type is cash
    

    Il data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Nell'esempio precedente, PROJECT_ID è l'ID del tuo progetto Google Cloud.

  2. Per visualizzare i risultati della query, fai clic su Esegui.

Creare un grafico

  1. Nel riquadro dei dati, fai clic su Visualizza.
  2. Fai clic su Crea grafico a barre.

    Il canvas di dati BigQuery crea un grafico a barre che mostra i chilometri percorsi più frequentemente in base all'ID viaggio. Oltre a fornire un grafico, la tela di dati BigQuery riassume alcuni dei dettagli chiave dei dati alla base della visualizzazione.

  3. (Facoltativo) Esegui una o più delle seguenti operazioni:

    • Per modificare il grafico, fai clic su Modifica e poi modificalo nel riquadro Modifica visualizzazione.
    • Per condividere il canvas di dati, fai clic su Condividi, quindi su Condividi link per copiare il link al canvas di dati BigQuery.
    • Per ripulire la canvas di dati, seleziona Altre azioni e poi Svuota canvas. Questo passaggio genera una tela vuota.

Esempio di flusso di lavoro: unione di tabelle

In questo esempio, utilizzi i prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare dati e unire tabelle. Poi esporta una query come notebook.

Prompt 1: trova i dati

  1. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    

    Il data canvas di BigQuery suggerisce diverse tabelle contenenti informazioni sugli alberi.

  2. Per questo esempio, seleziona la tabellabigquery-public-data.new_york_trees.tree_census_1995 e poi fai clic su Aggiungi al canvas.

    La tabella viene visualizzata nel canvas.

Prompt 2: unisci le tabelle in base all'indirizzo

  1. Nella tela dei dati, fai clic su Unisci.

    Il canvas di dati BigQuery suggerisce le tabelle da unire.

  2. Per aprire un nuovo campo del prompt in linguaggio naturale, fai clic su Cerca tabelle.

  3. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    
  4. Seleziona la tabella bigquery-public-data.new_york_trees.tree_census_2005 e poi fai clic su Aggiungi al riquadro.

    La tabella viene visualizzata nel canvas.

  5. Nella tela dei dati, fai clic su Unisci.

  6. Nella sezione In questo riquadro, seleziona la casella di controllo Cella tabella e poi fai clic su OK.

  7. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Join on address
    

    Il data canvas di BigQuery suggerisce la query SQL per unire queste due tabelle in base al loro indirizzo:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Per eseguire la query e visualizzare i risultati, fai clic su Esegui.

Esportare la query come notebook

Il canvas di dati BigQuery ti consente di esportare le query come notebook.

  1. Nel riquadro dei dati, fai clic su Esporta come notebook.
  2. Nel riquadro Salva il taccuino, inserisci il nome del taccuino e la regione in cui vuoi salvarlo.
  3. Fai clic su Salva. Il notebook è stato creato.
  4. (Facoltativo) Per visualizzare il blocco note creato, fai clic su Apri.

Flusso di lavoro di esempio: modifica di un grafico utilizzando un prompt

In questo esempio, utilizzi i prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare, eseguire query e filtrare i dati, quindi modificare i dettagli della visualizzazione.

Prompt 1: trova i dati

  1. Per trovare i dati sui nomi negli Stati Uniti, inserisci il seguente prompt:

    Find data about USA names
    

    Il data canvas di BigQuery genera un elenco di tabelle.

  2. Per questo esempio, seleziona la tabella bigquery-public-data.usa_names.usa_1910_current e poi fai clic su Aggiungi al riquadro.

Prompt 2: esegui query sui dati

  1. Per eseguire una query sui dati, nel riquadro dei dati fai clic su Query e poi inserisci il seguente prompt:

    Summarize this data
    

    Il data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Fai clic su Esegui. Vengono visualizzati i risultati della query.

Prompt 3: filtra i dati

  1. Nel riquadro dei dati, fai clic su Esegui query su questi risultati.
  2. Per filtrare i dati, inserisci il seguente prompt nel campo del prompt SQL:

    Get me the top 10 most popular names in 1980
    

    Il data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Quando esegui la query, viene visualizzata una tabella con i dieci nomi più comuni dei bambini nati nel 1980.

Creare e modificare un grafico

  1. Nel riquadro dei dati, fai clic su Visualizza.

    Il data canvas BigQuery suggerisce diverse opzioni di visualizzazione, tra cui un grafico a barre, un grafico a torta, un grafico a linee e una visualizzazione personalizzata.

  2. Per questo esempio, fai clic su Crea grafico a barre.

    Il data canvas di BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei dieci nomi principali.

Oltre a fornire un grafico, il canvas di dati BigQuery riassume alcuni dei dettagli chiave degli elementi che supportano la visualizzazione. Puoi modificare il grafico facendo clic su Dettagli visualizzazione e modificandolo nel riquadro laterale.

Prompt 4: Modifica i dettagli della visualizzazione

  1. Nel campo del prompt Visualizzazione, inserisci quanto segue:

    Create a bar chart sorted high to low, with a gradient
    

    Il data canvas di BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei dieci nomi più cercati ordinati.

  2. (Facoltativo) Per apportare ulteriori modifiche, fai clic su Modifica.

    Viene visualizzato il riquadro Modifica visualizzazione. Puoi modificare dettagli come il titolo del grafico, il nome dell'asse x e il nome dell'asse y. Inoltre, se fai clic sulla scheda Editor JSON, puoi modificare direttamente il grafico in base ai valori JSON.

Visualizza tutti i canvas di dati

Per visualizzare un elenco di tutti i canvas di dati nel tuo progetto, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, fai clic su Visualizza azioni accanto a Canvas di dati, quindi esegui una delle seguenti operazioni:

  • Per aprire l'elenco nella scheda corrente, fai clic su Mostra tutto.
  • Per aprire l'elenco in una nuova scheda, fai clic su Mostra tutto in > Nuova scheda.
  • Per aprire l'elenco in una scheda divisa, fai clic su Mostra tutto in > Scheda divisa.

Visualizzare i metadati della tela di dati

Per visualizzare i metadati della tela di dati:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati di cui vuoi visualizzare i metadati.

  3. Esamina il riquadro Riepilogo per visualizzare informazioni sul riquadro dei dati, ad esempio la regione utilizzata e la data dell'ultima modifica.

Lavorare con le versioni del data canvas

Puoi visualizzare, confrontare e ripristinare le versioni di un canvas di dati.

Visualizzare e confrontare le versioni del data canvas

Per visualizzare versioni diverse di un canvas di dati e confrontarle con la versione corrente, procedi nel seguente modo:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati per cui vuoi visualizzare l'attività.

  3. Fai clic sulla scheda Attività per visualizzare un elenco delle versioni del canvas di dati in ordine decrescente per data.

  4. Fai clic su Visualizza azioni accanto a una versione della tela di dati, quindi su Confronta. Si apre il riquadro di confronto, che mostra la versione del canvas di dati selezionata con la versione corrente del canvas di dati.

  5. (Facoltativo) Per confrontare le versioni in linea anziché in riquadri separati, fai clic su Confronta e poi su In linea.

Ripristinare una versione del canvas di dati

Utilizza una delle seguenti opzioni per ripristinare una versione della tela di dati. Il ripristino dal riquadro di confronto ti consente di confrontare la versione precedente del canvas di dati con quella corrente prima di scegliere se ripristinarla.

Riquadro Attività

  1. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome della tela di dati di cui vuoi ripristinare una versione precedente.
  2. Seleziona il riquadro Attività.
  3. Fai clic su Visualizza azioni accanto alla versione della tela di dati che vuoi ripristinare e poi su Ripristina.
  4. Fai clic su Conferma per confermare l'azione.

Riquadro di confronto

  1. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome della tela di dati di cui vuoi ripristinare una versione precedente.
  2. Seleziona il riquadro Attività.
  3. Fai clic su Visualizza azioni accanto a una versione della tela di dati, quindi su Confronta. Si apre il riquadro di confronto, che mostra la versione della tela di dati selezionata rispetto alla versione più recente.
  4. Se vuoi ripristinare la versione precedente della tela di dati dopo il confronto, fai clic su Ripristina.
  5. Fai clic su Conferma per confermare l'azione.

Prezzi

Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.

Quote e limiti

Per informazioni su quote e limiti per questa funzionalità, consulta Quote per Gemini in BigQuery.

Invia il tuo feedback

Puoi contribuire a migliorare i suggerimenti del canvas di dati BigQuery inviando un feedback a Google. Per fornire un feedback:

  1. Nella barra degli strumenti della console Google Cloud, fai clic su Invia feedback.

  2. (Facoltativo) Per copiare le informazioni JSON del DAG al fine di fornire un contesto aggiuntivo al tuo feedback, fai clic su Copia.

  3. Per compilare il modulo e fornire un feedback, fai clic su modulo.

Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable e serviceusage.services.list. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, vedi Gemini nel programma Trusted Tester di Google Cloud.

Per fornire un feedback diretto su questa funzionalità, puoi anche contattare datacanvas-feedback@google.com.

Passaggi successivi