Analizza i dati con l'assistenza di Gemini per Google Cloud

Questo tutorial descrive come puoi utilizzare Gemini per Google Cloud, un collaboratore basato sull'AI per Google Cloud, per analizzare i dati. Nel tutorial usi Gemini in BigQuery per analizzare e prevedere le vendite dei prodotti.

Questo tutorial presuppone che tu conosca l'SQL e le attività di base di analisi dei dati. Non si presume la conoscenza dei prodotti Google Cloud. Se non hai mai utilizzato BigQuery, consulta le guide rapide su BigQuery.

Obiettivi

  • Usa Gemini per rispondere alle tue domande sui prodotti di analisi dei dati e sui casi d'uso di Google Cloud.
  • Chiedi a Gemini di spiegare e generare query SQL in BigQuery.
  • Crea un modello di machine learning (ML) per prevedere cicli futuri.

Costi

Questo tutorial utilizza i seguenti componenti fatturabili di Google Cloud:

Utilizza il Calcolatore prezzi per stimare i costi in base all'utilizzo previsto.

Prima di iniziare

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Assicurati di aver configurato Gemini in BigQuery nel tuo progetto Google Cloud.
  3. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  4. Crea un set di dati denominato bqml_tutorial. Puoi usare il set di dati per archiviare gli oggetti del database, inclusi tabelle e modelli.

  5. Abilita le funzionalità di Gemini in BigQuery necessarie per completare questo tutorial:

    1. Per visualizzare le funzionalità di Gemini in BigQuery, fai clic su pen_spark Gemini nella barra degli strumenti.

    2. Nell'elenco Gemini in BigQuery SQL Editor, seleziona tutte le seguenti opzioni:

      • Completamento automatico
      • Generazione automatica
      • Spiegazione

    Per disabilitare le funzionalità di Gemini in BigQuery, deseleziona quelle che vuoi disabilitare.

Usare Gemini per analizzare i dati

Gemini può aiutarti a sapere a quali dati puoi accedere per l'analisi e come analizzarli.

Prima di poter eseguire query sui dati, devi sapere a quali dati puoi accedere. Ogni prodotto dati organizza e archivia i dati in modo diverso. Per ricevere assistenza, puoi inviare a Gemini un'istruzione in linguaggio naturale (o un prompt) come "Come posso visualizzare quali set di dati e tabelle sono disponibili in BigQuery?"

Per comprendere le caratteristiche dei diversi sistemi di query sui dati, potresti chiedere a Gemini informazioni specifiche sul prodotto, come le seguenti:

  • "Come faccio a iniziare a utilizzare BigQuery?"
  • "Quali sono i vantaggi dell'utilizzo di BigQuery per l'analisi dei dati?"
  • "In che modo BigQuery gestisce la scalabilità automatica per le query?"

Gemini può anche fornire informazioni su come analizzare i tuoi dati. Per questo tipo di aiuto, potresti inviare prompt a Gemini come i seguenti:

  • "Come faccio a creare un modello di previsione delle serie temporali in BigQuery?"
  • "Come faccio a caricare diversi tipi di dati in BigQuery?"

Per chiedere a Gemini di rispondere a domande sui tuoi dati, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nella barra degli strumenti della console Google Cloud, fai clic su spark Apri Gemini.

  3. Nel riquadro Gemini, inserisci un prompt come How do I learn which datasets and tables are available to me in BigQuery?.

  4. Fai clic su Invia Invia prompt.

    Scopri come e quando Gemini per Google Cloud utilizza i tuoi dati.

    Gemini restituisce una risposta simile alla seguente:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. (Facoltativo) Per reimpostare la cronologia chat, nel riquadro Gemini, fai clic sull'icona Elimina, quindi su Reimposta chat.

Utilizza Gemini per comprendere e scrivere codice SQL in BigQuery

Gemini può aiutarti a lavorare con SQL. Ad esempio, se lavori con query SQL scritte da altre persone, Gemini in BigQuery può spiegare una query complessa in linguaggio semplice. Tali spiegazioni possono aiutarti a comprendere la sintassi delle query, lo schema sottostante e il contesto aziendale.

Chiedi a Gemini di spiegare le query SQL in un set di dati delle vendite

Per chiedere a Gemini di spiegare una query SQL di esempio, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor query, apri o incolla la query per cui vuoi ricevere una spiegazione.

    Ad esempio, potresti voler capire la relazione tra tabelle e query di dati in un set di dati delle vendite e ricevere aiuto per la scrittura di query che utilizzano il set di dati. Nella query di esempio che segue puoi capire quali tabelle vengono utilizzate, ma l'analisi e la comprensione di altre sezioni della query potrebbero richiedere tempo.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Evidenzia la query che vuoi che Gemini spieghi, quindi fai clic su pen_spark. Spiega questa query.

    La spiegazione SQL viene visualizzata nel riquadro Gemini.

    Utilizzando la query di esempio del passaggio precedente, Gemini restituisce una spiegazione simile alla seguente:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Genera una query SQL che raggruppa le vendite per giorno e prodotto

Puoi fornire a Gemini un prompt per generare una query SQL in base allo schema dei tuoi dati. Anche se inizi senza codice, una conoscenza limitata dello schema dei dati o solo una conoscenza di base della sintassi SQL, Gemini può suggerire una o più istruzioni SQL.

Nell'esempio seguente, generi una query che elenca i tuoi prodotti principali per ogni giorno. Questo tipo di query è spesso complesso, ma con Gemini puoi creare automaticamente un'istruzione. Quindi, usi le tabelle nel set di dati thelook_ecommerce e chiedi a Gemini di generare una query per calcolare le vendite per articolo dell'ordine e per nome del prodotto.

Per chiedere a Gemini di generare una query che elenca i tuoi prodotti principali, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, fai clic su BigQuery Studio.

  3. Fai clic su Crea una nuova query. Il riquadro Explorer carica automaticamente il database selezionato.

  4. Nell'editor query, inserisci il seguente prompt e premi Invio. Il carattere cancelletto (#) richiede a Gemini di generare SQL.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini suggerisce una query SQL simile alla seguente:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Per accettare il codice suggerito, fai clic su Tab, quindi su Esegui per eseguire l'istruzione SQL. Puoi anche scorrere l'SQL suggerito e accettare parole specifiche suggerite nell'istruzione.

  6. Nel riquadro Risultati delle query visualizza i risultati della query.

Creare un modello di previsione e visualizzare i risultati

In questa sezione utilizzerai BigQuery ML per:

  • Utilizzare una query di tendenza per creare un modello di previsione.
  • Usa Gemini per spiegare e aiutarti a scrivere una query per visualizzare i risultati del modello di previsione.

Utilizzi la seguente query di esempio con le vendite effettive, che vengono utilizzate come input per il modello. La query viene utilizzata come parte della creazione del modello ML.

  1. Per creare un modello ML di previsione, esegui questo comando SQL nell'editor SQL di BigQuery:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Puoi utilizzare Gemini per comprendere questa query

    Una volta creato il modello, nel riquadro Risultati viene visualizzato un messaggio simile al seguente:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Nel riquadro Gemini, inserisci un prompt in modo che Gemini ti aiuti a scrivere una query per ottenere una previsione dal modello una volta completato. Ad esempio, inserisci How can I get a forecast in SQL from the model?

    In base al contesto del prompt, Gemini restituisce un esempio di modello ML che prevede le vendite:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Nel riquadro Gemini, copia la query SQL.

  4. Nell'editor SQL di BigQuery, incolla ed esegui la query SQL.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi eliminare il progetto Google Cloud che hai creato per questo tutorial. In alternativa, puoi eliminare le singole risorse.

  1. Nella console Google Cloud, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.

Elimina il set di dati

L'eliminazione del progetto rimuove tutti i set di dati e tutte le tabelle nel progetto. Se preferisci riutilizzare il progetto, puoi eliminare il set di dati che hai creato in questo tutorial.

  1. Nella console Google Cloud, apri la pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, seleziona il set di dati bqml_tutorial che hai creato.

  3. Per eliminare il set di dati, la tabella e tutti i dati, fai clic su Elimina set di dati.

  4. Per confermare l'eliminazione, nella finestra di dialogo Elimina set di dati digita il nome del set di dati (bqml_tutorial) e fai clic su Elimina.

Passaggi successivi