Analyser des données avec Gemini pour l'assistance Google Cloud

Ce tutoriel explique comment analyser des données à l'aide de Gemini pour Google Cloud, un collaborateur alimenté par l'IA pour Google Cloud. Dans ce tutoriel, vous allez utiliser Gemini dans BigQuery pour analyser et prédire les ventes de produits.

Dans ce tutoriel, nous partons du principe que vous connaissez SQL et les tâches de base d'analyse de données. Il n'est pas nécessaire de maîtriser les produits Google Cloud. Si vous débutez avec BigQuery, consultez les guides de démarrage rapide de BigQuery.

Objectifs

  • Utilisez Gemini pour répondre à vos questions sur les produits d'analyse de données Google Cloud
  • Invitez Gemini à expliquer et à générer des requêtes SQL dans BigQuery.
  • Créer un modèle de machine learning (ML) pour prédire des périodes ultérieures

Coûts

Ce tutoriel utilise les composants facturables suivants de Google Cloud :

Utilisez le simulateur de coût pour estimer vos coûts en fonction de votre utilisation prévue.

Avant de commencer

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Assurez-vous d'avoir configuré Gemini dans BigQuery dans votre projet Google Cloud.
  3. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  4. Créez un ensemble de données nommé bqml_tutorial. L'ensemble de données sert à stocker des objets de base de données, y compris des tables et des modèles.

  5. Activez les fonctionnalités Gemini dans BigQuery dont vous avez besoin pour suivre ce tutoriel:

    1. Pour afficher les fonctionnalités de Gemini dans BigQuery, cliquez sur pen_spark Gemini dans la barre d'outils.

    2. Dans la liste Gemini dans l'éditeur SQL de BigQuery, sélectionnez toutes les options suivantes:

      • Saisie semi-automatique
      • Génération automatique
      • Explication

    Pour désactiver les fonctionnalités Gemini dans BigQuery, désélectionnez celles que vous souhaitez désactiver.

Utiliser Gemini pour analyser vos données

Gemini peut vous aider à savoir à quelles données vous pouvez accéder pour l'analyse et comment les analyser.

Avant de pouvoir les interroger, vous devez savoir à quelles données vous avez accès. Chaque produit de données organise et stocke les données différemment. Pour obtenir de l'aide, vous pouvez envoyer à Gemini une instruction en langage naturel (ou une requête) telle que "Comment afficher les ensembles de données et les tables disponibles dans BigQuery ?"

Si vous souhaitez comprendre les caractéristiques de différents systèmes de requête de données, vous pouvez demander à Gemini de fournir des informations spécifiques sur le produit, par exemple:

  • "How do I get started with BigQuery?" (Comment me lancer avec BigQuery ?)
  • "What are the benefits of using BigQuery for data analysis?" (Quels sont les avantages de BigQuery pour l'analyse de données ?)
  • "How does BigQuery handle auto-scaling for queries?" (Comment fonctionne l'autoscaling de BigQuery pour gérer les requêtes ?)

Gemini peut également vous fournir des informations sur la façon d'analyser vos données. Pour ce type d'aide, vous pouvez envoyer des requêtes Gemini telles que:

  • "Comment créer un modèle de prévision de séries temporelles dans BigQuery ?"
  • "Comment charger différents types de données dans BigQuery ?"

Pour inviter Gemini à répondre à des questions concernant vos données, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans la barre d'outils de la console Google Cloud, cliquez sur spark Ouvrir Gemini.

  3. Dans le volet Gemini, saisissez une requête telle que How do I learn which datasets and tables are available to me in BigQuery?.

  4. Cliquez sur Envoyer Envoyer la requête.

    Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

    Gemini devrait proposer une réponse semblable à celle-ci :

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Facultatif: Pour réinitialiser l'historique de vos discussions, dans le volet Gemini, cliquez sur l'icône Supprimer, puis sur Réinitialiser la discussion.

Utiliser Gemini pour comprendre et écrire du code SQL dans BigQuery

Gemini peut vous aider à travailler avec le SQL. Par exemple, si vous travaillez avec des requêtes SQL écrites par d'autres personnes, Gemini dans BigQuery peut expliquer une requête complexe en langage clair. Ces explications peuvent vous aider à comprendre la syntaxe de la requête, le schéma sous-jacent et le contexte métier.

Demander à Gemini d'expliquer les requêtes SQL dans un ensemble de données de ventes

Pour demander à Gemini d'expliquer un exemple de requête SQL, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.

    Par exemple, si vous souhaitez comprendre comment les tables de données et les requêtes sont liées dans un ensemble de données de ventes, vous pouvez avoir besoin d'aide pour rédiger des requêtes qui utilisent cet ensemble de données. Dans l'exemple de requête suivant, vous pouvez comprendre quelles tables sont utilisées, mais l'analyse et la compréhension des autres sections peuvent vous prendre du temps.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Mettez en surbrillance la requête que vous souhaitez que Gemini explique, puis cliquez sur pen_spark Expliquer cette requête.

    L'explication de la requête SQL apparaît dans le volet Gemini.

    En utilisant l'exemple de requête de l'étape précédente, Gemini renvoie une explication semblable à la suivante:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Générer une requête SQL qui regroupe les ventes par jour et par produit

Vous pouvez fournir à Gemini une requête pour générer une requête SQL basée sur le schéma de vos données. Même si vous commencez sans code, avec une connaissance limitée du schéma de données ou seulement une connaissance de base de la syntaxe SQL, Gemini peut suggérer une ou plusieurs instructions SQL.

Dans l'exemple suivant, vous allez générer une requête qui liste vos principaux produits pour chaque jour. Ce type de requête est souvent complexe, mais avec Gemini, vous pouvez créer automatiquement une instruction. Vous utilisez ensuite les tables de l'ensemble de données thelook_ecommerce et demandez à Gemini de générer une requête pour calculer les ventes par article et par nom de produit.

Pour demander à Gemini de générer une requête listant vos produits populaires, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le menu de navigation, cliquez sur BigQuery Studio.

  3. Cliquez sur Saisir une nouvelle requête. Le volet Explorateur charge automatiquement la base de données sélectionnée.

  4. Dans l'éditeur de requête, saisissez l'invite suivante, puis appuyez sur Entrée. Le caractère dièse (#) invite Gemini à générer le code SQL.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Gemini suggère une requête SQL semblable à celle-ci :

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Pour accepter le code suggéré, cliquez sur Tabulation, puis sur Exécuter pour exécuter l'instruction SQL. Vous pouvez également faire défiler le code SQL suggéré et accepter les mots spécifiques suggérés dans l'instruction.

  6. Examinez les résultats dans le volet Résultats de la requête.

Créer un modèle de prévision et afficher les résultats

Dans cette section, vous allez utiliser BigQuery ML pour effectuer les opérations suivantes:

  • Utiliser une requête de tendance pour créer un modèle de prévision
  • Utilisez Gemini pour expliquer et vous aider à écrire une requête permettant d'afficher les résultats du modèle de prévision.

Vous allez utiliser l'exemple de requête suivant avec des ventes réelles, qui seront utilisées comme entrées dans le modèle. La requête fait partie de la création du modèle de ML.

  1. Pour créer un modèle de ML de prévision, dans l'éditeur SQL de BigQuery, exécutez la requête SQL suivante:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Vous pouvez utiliser Gemini pour vous aider à comprendre cette requête

    Une fois le modèle créé, le volet Results (Résultats) affiche un message semblable à celui-ci:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Dans le volet Gemini, saisissez une requête afin que Gemini vous aide à écrire une requête permettant d'obtenir une prévision du modèle une fois l'opération terminée. Par exemple, saisissez How can I get a forecast in SQL from the model?.

    En fonction du contexte de la requête, Gemini renvoie un exemple de modèle de ML prévoyant les ventes:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Dans le volet Gemini, copiez la requête SQL.

  4. Dans l'éditeur SQL BigQuery, collez, puis exécutez la requête SQL.

Effectuer un nettoyage

Pour éviter que les ressources utilisées lors de ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez supprimer le projet Google Cloud que vous avez créé pour ce tutoriel. Vous pouvez également supprimer les différentes ressources.

  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Supprimer l'ensemble de données

Si vous supprimez votre projet, tous les ensembles de données et toutes les tables qui lui sont associés sont également supprimés. Si vous préférez réutiliser le projet, vous pouvez supprimer l'ensemble de données que vous avez créé dans ce tutoriel.

  1. Dans la console Google Cloud, ouvrez la page BigQuery.

    Accéder à BigQuery

  2. Dans le volet de navigation, sélectionnez l'ensemble de données bqml_tutorial que vous avez créé.

  3. Pour supprimer l'ensemble de données, la table et toutes les données, cliquez sur Supprimer l'ensemble de données.

  4. Pour confirmer la suppression, dans la boîte de dialogue Supprimer l'ensemble de données, saisissez le nom de votre ensemble de données (bqml_tutorial), puis cliquez sur Supprimer.

Étapes suivantes