Analyser des données avec Gemini pour obtenir l'aide de Google Cloud

Ce tutoriel explique comment analyser des données à l'aide de Gemini pour Google Cloud, un collaborateur de Google Cloud basé sur l'IA. Dans ce tutoriel, vous allez utiliser Gemini dans BigQuery pour analyser et prédire les ventes de produits.

Dans ce tutoriel, nous partons du principe que vous maîtrisez SQL et les tâches de base de l'analyse de données. La connaissance des produits Google Cloud n'est pas garantie. Si vous débutez avec BigQuery, consultez les guides de démarrage rapide de BigQuery.

Objectifs

  • Utilisez Gemini pour répondre à vos questions sur les produits d'analyse de données et les cas d'utilisation de Google Cloud.
  • Invite Gemini pour expliquer et générer des requêtes SQL dans BigQuery.
  • Créer un modèle de machine learning (ML) pour prévoir les périodes à venir.

Coûts

Ce tutoriel utilise les composants facturables suivants de Google Cloud :

Utilisez le simulateur de coût pour estimer vos coûts en fonction de votre utilisation prévue.

Avant de commencer

  1. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  2. Assurez-vous d'avoir configuré Gemini dans BigQuery dans votre projet Google Cloud.
  3. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  4. Créez un ensemble de données nommé bqml_tutorial. Il sert à stocker des objets de base de données, y compris des tables et des modèles.

  5. Dans BigQuery, activez les fonctionnalités Gemini dont vous avez besoin pour suivre ce tutoriel:

    1. Pour afficher les fonctionnalités Gemini dans BigQuery, cliquez sur pen_spark Gemini dans la barre d'outils.

    2. Dans la liste Gemini in BigQuery SQL Editor (Gemini dans l'éditeur SQL BigQuery), sélectionnez toutes les options suivantes:

      • Saisie semi-automatique
      • Génération automatique
      • Explication

    Pour désactiver les fonctionnalités Gemini dans BigQuery, désélectionnez-les.

Utiliser Gemini pour analyser vos données

Gemini peut vous aider à savoir à quelles données vous pouvez accéder pour l'analyse et comment les analyser.

Avant d'interroger des données, vous devez savoir à quelles données vous pouvez accéder. Chaque produit de données organise et stocke les données différemment. Pour obtenir de l'aide, vous pouvez envoyer à Gemini une instruction en langage naturel (ou une invite) telle que "Comment afficher les ensembles de données et les tables disponibles dans BigQuery ?".

Si vous souhaitez comprendre les caractéristiques de différents systèmes de requête de données, vous pouvez demander à Gemini de fournir des informations spécifiques sur le produit, comme les suivantes:

  • "Comment démarrer avec BigQuery ?"
  • "Quels sont les avantages d'utiliser BigQuery pour l'analyse de données ?"
  • "Comment BigQuery gère-t-il l'autoscaling pour les requêtes ?"

Gemini peut également fournir des informations sur la façon d'analyser vos données. Pour ce type d'aide, vous pouvez envoyer des requêtes Gemini telles que:

  • "Comment créer un modèle de prévision de séries temporelles dans BigQuery ?"
  • « Comment charger différents types de données dans BigQuery ? »

Pour inviter Gemini à répondre à des questions concernant vos données, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans la barre d'outils de la console Google Cloud, cliquez sur spark Ouvrir Gemini.

  3. Dans le volet Gemini, saisissez une requête telle que How do I learn which datasets and tables are available to me in BigQuery?.

  4. Cliquez sur Envoyer Envoyer une requête.

    Gemini n'utilise pas vos requêtes ni ses réponses comme données pour entraîner ses modèles. Pour en savoir plus, consultez la section Utilisation de vos données par Gemini pour Google Cloud.

    Gemini renvoie une réponse semblable à celle-ci:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Facultatif: Pour réinitialiser l'historique de vos discussions, dans le volet Gemini, cliquez sur l'icône Supprimer, puis sur Réinitialiser la discussion.

Utiliser Gemini pour comprendre et écrire du code SQL dans BigQuery

Gemini peut vous aider à travailler avec SQL. Par exemple, si vous travaillez avec des requêtes SQL écrites par d'autres personnes, Gemini dans BigQuery peut expliquer une requête complexe en langage clair. De telles explications peuvent vous aider à comprendre la syntaxe de la requête, le schéma sous-jacent et le contexte métier.

Demander à Gemini d'expliquer les requêtes SQL dans un ensemble de données de ventes

Pour demander à Gemini d'expliquer un exemple de requête SQL, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.

    Par exemple, vous souhaiterez peut-être comprendre la relation entre les tables de données et les requêtes dans un ensemble de données de ventes, ou avoir besoin d'aide pour rédiger des requêtes utilisant cet ensemble de données. Dans l'exemple de requête suivant, vous comprendrez peut-être quelles tables sont utilisées, mais l'analyse et la compréhension d'autres sections de la requête peuvent prendre du temps.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Mettez en surbrillance la requête que vous souhaitez expliquer par Gemini, puis cliquez sur pen_spark Expliquer cette requête.

    L'explication SQL apparaît dans le volet Gemini.

    À l'aide de l'exemple de requête de l'étape précédente, Gemini renvoie une explication semblable à celle-ci:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Générer une requête SQL qui regroupe les ventes par jour et par produit

Vous pouvez fournir à Gemini une invite lui permettant de générer une requête SQL basée sur le schéma de vos données. Même si vous débutez sans code, avec une connaissance limitée du schéma de données ou seulement une connaissance de base de la syntaxe SQL, Genmini peut vous suggérer une ou plusieurs instructions SQL.

Dans l'exemple suivant, vous générez une requête qui liste vos produits les plus populaires chaque jour. Ce type de requête est souvent complexe, mais Gemini vous permet de créer automatiquement une instruction. Vous utiliserez ensuite des tables dans l'ensemble de données thelook_ecommerce et inviterez Gemini à générer une requête pour calculer les ventes par article et par nom de produit.

Pour demander à Gemini de générer une requête listant vos produits populaires, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le menu de navigation, cliquez sur BigQuery.

  3. Cliquez sur Saisir une nouvelle requête. Le volet Explorateur charge automatiquement la base de données sélectionnée.

  4. Dans l'éditeur de requête, saisissez l'invite suivante, puis appuyez sur Entrée. Le caractère dièse (#) invite Gemini à générer du code SQL.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini suggère une requête SQL semblable à celle-ci:

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Pour accepter le code suggéré, cliquez sur Tab, puis sur Run (Exécuter) pour exécuter l'instruction SQL. Vous pouvez également faire défiler les suggestions SQL et accepter des mots spécifiques suggérés dans l'instruction.

  6. Dans le volet Résultats de la requête, affichez les résultats.

Créer un modèle de prévision et afficher les résultats

Dans cette section, vous allez utiliser BigQuery ML pour effectuer les opérations suivantes:

  • Créer un modèle de prévision à l'aide d'une requête de tendance
  • Gemini vous explique et vous aide à rédiger une requête permettant d'afficher les résultats du modèle de prévision.

Vous allez utiliser l'exemple de requête suivant avec les ventes réelles, qui sont utilisées en tant qu'entrée dans le modèle. La requête est utilisée dans le cadre de la création du modèle de ML.

  1. Pour créer un modèle de ML de prévision, exécutez la commande SQL suivante dans l'éditeur SQL de BigQuery:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Gemini vous permet de comprendre cette requête.

    Une fois le modèle créé, le volet Results (Résultats) affiche un message semblable à celui-ci:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Dans le volet Gemini, saisissez une invite pour que Gemini vous aide à écrire une requête permettant d'obtenir une prévision du modèle une fois l'opération terminée. Par exemple, saisissez How can I get a forecast in SQL from the model?.

    En fonction du contexte de la requête, Gemini renvoie un exemple de modèle de ML qui prévoit les ventes:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Dans le volet Gemini, copiez la requête SQL.

  4. Dans l'éditeur SQL BigQuery, collez et exécutez la requête SQL.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez supprimer le projet Google Cloud que vous avez créé pour ce tutoriel. Vous pouvez également supprimer les différentes ressources.

  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Supprimer l'ensemble de données

Si vous supprimez votre projet, tous les ensembles de données et toutes les tables qui lui sont associés sont également supprimés. Si vous préférez réutiliser le projet, vous pouvez supprimer l'ensemble de données que vous avez créé dans ce tutoriel.

  1. Dans la console Google Cloud, ouvrez la page BigQuery.

    Accéder à BigQuery

  2. Dans le panneau de navigation, sélectionnez l'ensemble de données bqml_tutorial que vous avez créé.

  3. Pour supprimer l'ensemble de données, la table et toutes les données, cliquez sur Supprimer l'ensemble de données.

  4. Pour confirmer la suppression, dans la boîte de dialogue Supprimer l'ensemble de données, saisissez le nom de votre ensemble de données (bqml_tutorial), puis cliquez sur Supprimer.

Étapes suivantes