Analizza i dati con l'assistenza di Gemini

Questo tutorial descrive come utilizzare l'assistenza basata sull'AI in Gemini in BigQuery per analizzare i dati.

Per l'esempio di questo tutorial, immagina di essere un data analyst che deve analizzare e prevedere le vendite di prodotti da un set di dati.

Questo tutorial presuppone che tu abbia dimestichezza con SQL e con le attività di analisi di dati di base. Non si presume la conoscenza dei prodotti Google Cloud. Se non hai mai utilizzato BigQuery, consulta i comandi iniziali di BigQuery.

Obiettivi

  • Utilizza Gemini in BigQuery per rispondere a domande su come BigQuery gestisce attività specifiche di analisi dei dati.
  • Chiedi a Gemini in BigQuery di trovare set di dati, nonché di spiegare e generare query SQL.
  • Crea un modello di machine learning (ML) per prevedere i periodi futuri.

Costi

Questo tutorial utilizza i seguenti prodotti Google Cloud fatturabili:

Per stimare i costi in base all'utilizzo previsto, utilizza il Calcolatore prezzi.

Prima di iniziare

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Assicurati che Gemini in BigQuery sia configurato per il tuo progetto Google Cloud.
  3. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  4. Crea un set di dati denominato bqml_tutorial. Utilizzi il set di dati per archiviare gli oggetti database, tra cui tabelle e modelli.

  5. Per attivare le funzionalità di Gemini in BigQuery di cui hai bisogno per completare questo tutorial, nella barra degli strumenti di BigQuery, fai clic su pen_spark Gemini, quindi seleziona le seguenti opzioni:

    • Completamento automatico
    • Genesi automatica
    • Spiegazione

Scopri le funzionalità di BigQuery

Prima di iniziare, ti consigliamo di scoprire di più su come BigQuery gestisce l'esecuzione di query sui dati. Per ricevere assistenza, puoi inviare a Gemini in BigQuery un'affermazione in linguaggio naturale (o prompt) come la seguente:

  • "Come faccio a iniziare a utilizzare BigQuery?"
  • "Quali sono i vantaggi dell'utilizzo di BigQuery per l'analisi dei dati?"
  • "Come gestisce BigQuery la scalabilità automatica per le query?"

Gemini in BigQuery può anche fornire informazioni su come analizzare i dati. Per questo tipo di assistenza, puoi inviare prompt come i seguenti:

  • "Come faccio a creare un modello di previsione delle serie temporali in BigQuery?"
  • "Come faccio a caricare diversi tipi di dati in BigQuery?"

Accedi e analizza i dati

Gemini in BigQuery può aiutarti a sapere a quali dati puoi accedere per l'analisi e come analizzarli.

Per questo esempio, immagina di aver bisogno di assistenza per quanto segue:

  • Trovare set di dati e tabelle di vendita da analizzare.
  • Conoscere la relazione tra tabelle di dati e query in un set di dati sulle vendite.
  • Comprendere le query complesse e scrivere query che utilizzano il set di dati.

Trovare i dati

Prima di poter eseguire query sui dati, devi sapere a quali dati puoi accedere. Ogni prodotto di dati organizza e archivia i dati in modo diverso.

Per ricevere assistenza, puoi inviare a Gemini in BigQuery un prompt come "Come faccio a sapere quali set di dati e tabelle sono disponibili in BigQuery?"

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nella barra degli strumenti della console Google Cloud, fai clic su spark Apri o chiudi la chat dell'AI di Gemini.

  3. Nel riquadro Gemini, inserisci il prompt How do I learn which datasets and tables are available to me in BigQuery?.

  4. Fai clic su send Invia richiesta.

    Scopri come e quando Gemini for Google Cloud utilizza i tuoi dati.

    La risposta include diversi modi per elencare progetti, set di dati o tabelle all'interno di un set di dati.

  5. (Facoltativo) Per reimpostare la cronologia chat, nel riquadro Gemini, fai clic su delete Cancella chat e poi su Reimposta chat.

Comprendere e scrivere SQL in BigQuery

Per questo esempio, supponiamo che tu abbia selezionato i dati da analizzare e ora voglia eseguire query su questi dati. Gemini in BigQuery può aiutarti a lavorare con SQL, ad esempio per comprendere query complesse e difficili da analizzare o per generare nuove query SQL.

Richiedere l'assistenza di Gemini per spiegare le query SQL

Supponiamo che tu voglia comprendere una query complessa scritta da qualcun altro. Gemini in BigQuery può spiegare la query in linguaggio semplice, ad esempio la sintassi della query, lo schema sottostante e il contesto aziendale.

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor query, apri o incolla la query per cui vuoi ricevere una spiegazione. Ad esempio:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Evidenzia la query, poi fai clic su auto_awesome Spiega questa query selezionata.

    Nel riquadro Gemini viene restituita una risposta simile alla seguente:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Generare una query SQL che raggruppa le vendite per giorno e prodotto

In questo esempio, vuoi generare una query che elenchi i tuoi prodotti principali per ogni giorno. Poi utilizzi le tabelle nel set di dati thelook_ecommerce e chiedi a Gemini in BigQuery di generare una query per calcolare le vendite per articolo dell'ordine e per nome del prodotto.

Questo tipo di query è spesso complesso, ma utilizzando Gemini in BigQuery puoi creare automaticamente un'istruzione. Puoi fornire un prompt per generare una query SQL in base allo schema dei dati. Anche se inizi senza codice, con una conoscenza limitata dello schema dei dati o solo con una conoscenza di base della sintassi SQL, l'assistenza di Gemini può suggerire una o più istruzioni SQL.

Per chiedere a Gemini in BigQuery di generare una query che elenca i tuoi prodotti principali:

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, fai clic su BigQuery Studio.

  3. Fai clic su Query SQL. Il riquadro Esplorazione carica automaticamente il database selezionato.

  4. Nell'editor di query, inserisci il seguente prompt, quindi premi Invio:

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Il carattere pound (#) indica a Gemini in BigQuery di generare SQL. Gemini in BigQuery suggerisce una query SQL simile alla seguente:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Per accettare il codice suggerito, fai clic su Tab e poi su Esegui per eseguire l'istruzione SQL. Puoi anche scorrere il codice SQL suggerito e accettare parole specifiche suggerite nell'istruzione.

  6. Nel riquadro Risultati query, visualizza i risultati della query.

Crea un modello di previsione e visualizza i risultati

In questo esempio, utilizzi BigQuery ML per:

  • Utilizza una query sulle tendenze per creare un modello di previsione.
  • Utilizza Gemini in BigQuery per spiegare e aiutarti a scrivere una query per visualizzare i risultati del modello di previsione.

Utilizza la seguente query di esempio con le vendite effettive, che vengono utilizzate come input per il modello. La query viene utilizzata durante la creazione del modello ML.

  1. Per creare un modello ML di previsione, nell'editor query, esegui la seguente query SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Puoi utilizzare Gemini in BigQuery per aiutarti a comprendere questa query.

    Quando il modello viene creato, la scheda Risultati del riquadro Risultati query visualizza un messaggio simile al seguente:

    Successfully created model named sales_forecasting_model.
    
  2. Nel riquadro Gemini, inserisci un prompt per Gemini in BigQuery per aiutarti a scrivere una query per ottenere una previsione dal modello al termine. Ad esempio, inserisci How can I get a forecast in SQL from the model?

    In base al contesto del prompt, la risposta include un esempio di modello di ML che prevede le vendite:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    In questa risposta, PROJECT_ID è il tuo progetto Google Cloud.

  3. Nel riquadro Gemini, copia la query SQL.

  4. Nell'editor delle query, esegui la query SQL.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi eliminare il progetto Google Cloud che hai creato per questo tutorial. In alternativa, puoi eliminare le singole risorse.

Elimina progetto

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Eliminare il set di dati

L'eliminazione del progetto rimuove tutti i set di dati e tutte le tabelle nel progetto. Se preferisci riutilizzare il progetto, puoi eliminare il set di dati creato in questo tutorial.

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel menu di navigazione, seleziona il set di dati bqml_tutorial che hai creato.

  3. Per eliminare il set di dati, la tabella e tutti i dati, fai clic su Elimina set di dati.

  4. Per confermare l'eliminazione, nella finestra di dialogo Elimina set di dati, digita il nome del set di dati (bqml_tutorial) e fai clic su Elimina.

Passaggi successivi