Analyser des données avec l'aide de Gemini

Ce tutoriel explique comment utiliser l'assistance basée sur l'IA dans Gemini dans BigQuery pour analyser des données.

Pour l'exemple de ce tutoriel, supposons que vous êtes un analyste de données qui a besoin d'analyser et de prédire les ventes de produits d'un ensemble de données.

Ce tutoriel suppose que vous maîtrisez SQL et les tâches de base d'analyse de données. Il n'est pas nécessaire de maîtriser les produits Google Cloud. Si vous ne connaissez pas encore BigQuery, consultez les guides de démarrage rapide de BigQuery.

Objectifs

  • Utiliser Gemini dans BigQuery pour répondre à des questions sur la façon dont BigQuery gère des tâches d'analyse de données spécifiques.
  • Demander à Gemini dans BigQuery de rechercher des ensembles de données, et d'expliquer et de générer des requêtes SQL
  • Créer un modèle de machine learning (ML) pour prédire des périodes ultérieures

Coûts

Ce tutoriel utilise les produits Google Cloud facturables suivants :

Pour estimer vos coûts en fonction de votre utilisation prévue, utilisez le simulateur de coût.

Avant de commencer

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Assurez-vous que Gemini dans BigQuery est configuré pour votre projet Google Cloud.
  3. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  4. Créez un ensemble de données nommé bqml_tutorial. Vous utilisez l'ensemble de données pour stocker des objets de base de données, y compris des tables et des modèles.

  5. Pour activer les fonctionnalités Gemini dans BigQuery dont vous avez besoin pour suivre ce tutoriel, cliquez sur pen_spark Gemini dans la barre d'outils BigQuery, puis sélectionnez les options suivantes:

    • Saisie semi-automatique
    • Génération automatique
    • Explication

Découvrir les fonctionnalités de BigQuery

Avant de commencer, envisagez d'en savoir plus sur la manière dont BigQuery gère les requêtes de données. Pour obtenir de l'aide, vous pouvez envoyer à Gemini dans BigQuery une instruction en langage naturel (une requête), par exemple :

  • "How do I get started with BigQuery?" (Comment me lancer avec BigQuery ?)
  • "What are the benefits of using BigQuery for data analysis?" (Quels sont les avantages de BigQuery pour l'analyse de données ?)
  • "How does BigQuery handle auto-scaling for queries?" (Comment fonctionne l'autoscaling de BigQuery pour gérer les requêtes ?)

Gemini dans BigQuery peut également vous fournir des informations sur la façon d'analyser vos données. Pour ce type d'aide, vous pouvez envoyer des requêtes telles que les suivantes:

  • "How do I create a time series forecasting model in BigQuery?" (Comment créer un modèle de prévision de séries temporelles dans BigQuery ?)
  • "How do I load different types of data into BigQuery?" (Comment charger différents types de données dans BigQuery ?)

Consulter et analyser des données

Gemini dans BigQuery peut vous aider à savoir à quelles données vous pouvez accéder pour analyse, et comment les analyser.

Pour cet exemple, supposons que vous ayez besoin d'aide pour les éléments suivants :

  • Rechercher un ensemble de données de ventes et des tables à analyser
  • Savoir comment les tables de données et les requêtes sont liées dans un ensemble de données de ventes
  • Comprendre les requêtes complexes et écrire des requêtes utilisant l'ensemble de données

Rechercher des données

Avant de pouvoir les interroger, vous devez savoir à quelles données vous avez accès. Chaque produit de données organise et stocke ses données différemment.

Pour obtenir de l'aide, vous pouvez envoyer à Gemini dans BigQuery une requête telle que "How do I learn which datasets and tables are available to me in BigQuery?" (Comment savoir quels ensembles de données et tables sont disponibles dans BigQuery ?).

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans la barre d'outils de la console Google Cloud, cliquez sur spark Ouvrir ou fermer le chat Gemini AI.

  3. Dans le volet Gemini, saisissez la requête suivante : How do I learn which datasets and tables are available to me in BigQuery?

  4. Cliquez sur send Envoyer une requête.

    Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

    La réponse inclut plusieurs façons de répertorier les projets, les ensembles de données ou les tables d'un ensemble de données.

  5. Facultatif : Pour réinitialiser l'historique de vos discussions, dans le volet Gemini, cliquez sur delete Gemini, puis sur Gemini.

Comprendre et écrire du code SQL dans BigQuery

Pour cet exemple, supposons que vous ayez sélectionné des données à analyser et que vous souhaitiez maintenant les interroger. Gemini dans BigQuery peut vous aider à travailler avec SQL, que ce soit pour vous aider à comprendre les requêtes complexes et difficiles à analyser ou pour générer de nouvelles requêtes SQL.

Demander de l'aide à Gemini pour expliquer les requêtes SQL

Supposons que vous souhaitiez comprendre une requête complexe écrite par un autre utilisateur. Gemini dans BigQuery peut expliquer la requête en langage brut, tel que la syntaxe de la requête, le schéma sous-jacent et le contexte commercial.

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications. Exemple :

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Mettez en surbrillance la requête, puis cliquez sur auto_awesome Expliquer cette requête sélectionnée.

    Dans le volet Gemini, une réponse semblable à celle-ci est renvoyée:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Générer une requête SQL qui regroupe les ventes par jour et par produit

Dans cet exemple, vous souhaitez générer une requête qui répertorie vos meilleurs produits chaque jour. Vous utiliserez ensuite les tables dans l'ensemble de données thelook_ecommerce et demanderez à Gemini dans BigQuery de générer une requête pour calculer les ventes par article commandé et par nom de produit.

Ce type de requête est souvent complexe, mais en utilisant Gemini dans BigQuery, vous pouvez créer automatiquement une instruction. Vous pouvez fournir une requête pour générer une requête SQL basée sur votre schéma de données. Même si vous commencez sans code, que vous avez une connaissance limitée du schéma de données ou que vous n'avez qu'une connaissance de base de la syntaxe SQL, l'assistance Gemini peut suggérer une ou plusieurs instructions SQL.

Pour demander à Gemini dans BigQuery de générer une requête qui liste vos meilleurs produits, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le menu de navigation, cliquez sur BigQuery Studio.

  3. Cliquez sur Saisir une nouvelle requête. Le volet Explorateur charge automatiquement la base de données sélectionnée.

  4. Dans l'éditeur de requête, saisissez la requête suivante puis appuyez sur Entrée.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    Le caractère dièse (#) indique à Gemini dans BigQuery qu'il doit générer une requête SQL. Gemini dans BigQuery suggère une requête SQL semblable à celle-ci:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Pour accepter le code suggéré, cliquez sur Onglet, puis sur Exécuter afin d'exécuter l'instruction SQL. Vous pouvez aussi parcourir les requêtes SQL proposées et accepter des éléments spécifiques suggérés dans une instruction.

  6. Examinez les résultats dans le volet Résultats de la requête.

Créer un modèle de prévision et afficher les résultats

Dans cet exemple, vous allez utiliser BigQuery ML pour :

  • Utiliser une requête de tendance pour créer un modèle de prévision.
  • Utiliser Gemini dans BigQuery pour expliquer et vous aider à écrire une requête permettant d'afficher les résultats du modèle de prévision.

Vous utiliserez l'exemple de requête ci-dessous avec les ventes réelles, qui serviront d'entrée au modèle. La requête fait partie de la création du modèle de ML.

  1. Pour créer un modèle de ML de prévision, exécutez la requête SQL suivante dans l'éditeur de requête:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Vous pouvez utiliser Gemini dans BigQuery pour vous aider à comprendre cette requête.

    Une fois le modèle créé, l'onglet Résultats du volet Résultats de la requête affiche un message semblable à celui-ci:

    Successfully created model named sales_forecasting_model.
    
  2. Dans le volet Gemini, demandez à Gemini dans BigQuery de vous aider à rédiger une requête permettant d'obtenir une prévision de la part du modèle (une fois celui-ci créé). Par exemple, saisissez How can I get a forecast in SQL from the model?.

    En se basant sur le contexte de la requête, la réponse inclut un exemple de modèle de ML qui prédit les ventes :

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    Dans cette réponse, PROJECT_ID correspond à votre projet Google Cloud.

  3. Dans le volet Gemini, copiez la requête SQL.

  4. Dans l'éditeur de requête, exécutez la requête SQL.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez supprimer le projet Google Cloud que vous avez créé pour l'occasion. Vous pouvez également supprimer les différentes ressources.

Supprimer le projet

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Supprimer l'ensemble de données

Si vous supprimez votre projet, tous les ensembles de données et toutes les tables qui lui sont associés sont également supprimés. Si vous préférez réutiliser le projet, vous pouvez supprimer l'ensemble de données que vous avez créé dans ce tutoriel.

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le menu de navigation, sélectionnez l'ensemble de données bqml_tutorial que vous avez créé.

  3. Pour supprimer l'ensemble de données, la table et toutes les données, cliquez sur Supprimer l'ensemble de données.

  4. Pour confirmer la suppression, dans la boîte de dialogue Supprimer l'ensemble de données, saisissez le nom de votre ensemble de données (bqml_tutorial), puis cliquez sur Supprimer.

Étape suivante