Analyser des données avec l'aide de Duet AI

Ce tutoriel explique comment utiliser Duet AI, un collaborateur de Google Cloud basé sur l'IA, pour analyser des données. Dans ce tutoriel, vous allez utiliser Duet AI dans BigQuery pour analyser et prédire les ventes de produits.

Dans ce tutoriel, nous partons du principe que vous maîtrisez SQL et les tâches de base de l'analyse de données. La connaissance des produits Google Cloud n'est pas envisagée. Si vous débutez avec BigQuery, consultez les guides de démarrage rapide de BigQuery.

Objectifs

  • Utilisez Duet AI pour répondre à vos questions sur les produits d'analyse de données et les cas d'utilisation de Google Cloud.
  • Demander à Duet AI d'expliquer et de générer des requêtes SQL dans BigQuery.
  • Créer un modèle de machine learning (ML) pour prévoir les périodes à venir

Coûts

Ce tutoriel utilise les composants facturables suivants de Google Cloud :

Estimez vos coûts en fonction de votre utilisation prévue à l'aide du simulateur de coût.

Avant de commencer

  1. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  2. Assurez-vous que Duet AI est configuré pour votre compte utilisateur et votre projet Google Cloud.
  3. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  4. Créez un ensemble de données nommé bqml_tutorial. Vous utilisez l'ensemble de données pour stocker des objets de la base de données, y compris des tables et des modèles.

  5. Dans BigQuery, activez les fonctionnalités Duet AI dont vous avez besoin pour suivre ce tutoriel:

    1. Pour afficher les fonctionnalités de Duet AI dans BigQuery, cliquez sur pen_spark Duet AI.

    2. Dans la liste Duet AI dans l'éditeur SQL BigQuery, sélectionnez toutes les options suivantes:

      • Saisie semi-automatique
      • Génération automatique
      • Explication

    Pour désactiver les fonctionnalités Duet AI dans BigQuery, désélectionnez celles que vous souhaitez désactiver.

Utiliser Duet AI pour analyser vos données

Duet AI peut vous aider à savoir à quelles données vous pouvez accéder pour l'analyse et comment les analyser.

Avant de pouvoir interroger des données, vous devez savoir à quelles données vous pouvez accéder. Chaque produit de données organise et stocke les données différemment. Pour obtenir de l'aide, vous pouvez envoyer à Duet AI une instruction en langage naturel (ou une invite) telle que "Comment afficher les ensembles de données et les tables disponibles dans BigQuery ?".

Si vous souhaitez comprendre les caractéristiques de différents systèmes de requête de données, vous pouvez demander à Duet AI de vous fournir des informations produit spécifiques, telles que les suivantes:

  • "Comment commencer à utiliser BigQuery ?"
  • "Quels sont les avantages d'utiliser BigQuery pour l'analyse de données ?"
  • "Comment BigQuery gère-t-il l'autoscaling pour les requêtes ?"

Duet AI peut également fournir des informations sur la façon d'analyser vos données. Pour ce type d'aide, vous pouvez envoyer des requêtes Duet AI telles que les suivantes:

  • "Comment créer un modèle de prévision de séries temporelles dans BigQuery ?"
  • « Comment charger différents types de données dans BigQuery ? »

Pour inviter Duet AI à répondre aux questions concernant vos données, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans la barre d'outils de la console Google Cloud, cliquez sur chat_spark Ouvrir Duet AI.

  3. Dans le volet Duet AI, saisissez une invite telle que How do I learn which datasets and tables are available to me in BigQuery?.

  4. Cliquez sur Envoyer Envoyer une invite.

    Duet AI n'utilise pas vos invites ni ses réponses comme données pour entraîner son modèle. Pour en savoir plus, consultez la page Comment Duet AI dans Google Cloud utilise vos données.

    Duet AI renvoie une réponse semblable à celle-ci:

    To learn which datasets and tables are available to you in
    BigQuery, you can use the Google Cloud console, the
    Google Cloud CLI, or the BigQuery API.
    ...
    
  5. Facultatif: Pour réinitialiser l'historique de vos discussions, dans le volet Duet AI, cliquez sur l'icône Supprimer, puis sur Réinitialiser la discussion.

Utiliser Duet AI pour comprendre et écrire du code SQL dans BigQuery

Duet AI peut vous aider à travailler avec SQL. Par exemple, si vous travaillez avec des requêtes SQL écrites par d'autres personnes, Duet AI dans BigQuery peut expliquer une requête complexe en langage clair. De telles explications peuvent vous aider à comprendre la syntaxe de la requête, le schéma sous-jacent et le contexte métier.

Inviter Duet AI à expliquer les requêtes SQL dans un ensemble de données de vente

Pour inviter Duet AI à expliquer un exemple de requête SQL, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.

    Par exemple, vous souhaiterez peut-être comprendre la relation entre les tables de données et les requêtes dans un ensemble de données de vente, ou vous aider à rédiger des requêtes qui utilisent cet ensemble de données. Dans l'exemple de requête suivant, vous pouvez comprendre quelles tables sont utilisées, mais l'analyse et la compréhension d'autres sections de la requête peuvent prendre du temps.

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` as u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi
    ON u.id = oi.user_id
    GROUP BY 1,2,3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. Mettez en surbrillance la requête que vous souhaitez que Duet AI explique, puis cliquez sur pen_spark pour expliquer cette requête.

    L'explication SQL apparaît dans le volet Duet AI.

    En reprenant l'exemple de requête de l'étape précédente, Duet AI affiche une explication semblable à celle-ci:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id , first_name , and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

Générer une requête SQL qui regroupe les ventes par jour et par produit

Vous pouvez fournir à Duet AI une invite pour générer une requête SQL basée sur le schéma de vos données. Même si vous commencez sans code, avec une connaissance limitée du schéma de données ou seulement une connaissance de base de la syntaxe SQL, Duet AI peut vous suggérer une ou plusieurs instructions SQL.

Dans l'exemple suivant, vous générez une requête qui répertorie vos produits les plus populaires chaque jour. Ce type de requête est souvent complexe, mais avec Duet AI, vous pouvez créer automatiquement une instruction. Vous utiliserez ensuite les tables de l'ensemble de données thelook_ecommerce et inviterez Duet AI à générer une requête pour calculer les ventes par article et par nom de produit.

Pour demander à Duet AI de générer une requête répertoriant vos principaux produits, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le menu de navigation, cliquez sur BigQuery.

  3. Cliquez sur Saisir une nouvelle requête. Le volet Explorateur charge automatiquement la base de données sélectionnée.

  4. Dans l'éditeur de requête, saisissez l'invite suivante, puis appuyez sur Entrée. Le caractère dièse (#) invite Duet AI à générer du code SQL.

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with products
    

    Duet AI suggère une requête SQL semblable à celle-ci :

    SELECT sum(sale_price),
    DATE(created_at),
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. Pour accepter le code suggéré, cliquez sur Tab, puis sur Run (Exécuter) pour exécuter l'instruction SQL. Vous pouvez également faire défiler la requête SQL suggérée et accepter des mots spécifiques suggérés dans l'instruction.

  6. Dans le volet Résultats de la requête, affichez les résultats de la requête.

Créer un modèle de prévision et afficher les résultats

Dans cette section, vous allez utiliser BigQuery ML pour effectuer les opérations suivantes:

  • Utilisez une requête de tendance pour créer un modèle de prévision.
  • Utilisez Duet AI pour expliquer et rédiger une requête permettant d'afficher les résultats du modèle de prévision.

Vous utilisez l'exemple de requête suivant avec les ventes réelles, qui sont utilisées en tant qu'entrée du modèle. La requête est utilisée dans le cadre de la création du modèle de ML.

  1. Pour créer un modèle de ML de prévision, exécutez la commande SQL suivante dans l'éditeur SQL BigQuery:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
    OPTIONS(MODEL_TYPE='ARIMA_PLUS',
    time_series_timestamp_col='date_col',
    time_series_data_col='total_sales',
    time_series_id_col='product_id') AS
    SELECT sum(sale_price) as total_sales,
    DATE(created_at) as date_col,
    product_id
    FROM `bigquery-public-data.thelook_ecommerce.order_items`
    AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products`
    AS t2
    ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    Vous pouvez utiliser Duet AI pour vous aider à comprendre cette requête.

    Une fois le modèle créé, le volet Results (Résultats) affiche un message semblable à celui-ci:

    This statement will replace the model named sales_forecasting_model.
    Depending on the type of model, this may take several hours to complete.
    
  2. Dans le volet Duet AI, saisissez une invite pour que Duet AI vous aide à rédiger une requête permettant d'obtenir une prévision du modèle une fois l'opération terminée. Par exemple, saisissez How can I get a forecast in SQL from the model?.

    En fonction du contexte de la requête, Duet AI affiche un exemple de modèle de ML qui prévoit les ventes:

    To get a forecast in SQL from the model, you can use the following query:
    
    SELECT
    *
    FROM
      ML.FORECAST(MODEL `PROJECT_ID.DATASET_ID.MODEL_NAME`,
    STRUCT(
          7 AS horizon,
          0.95 AS confidence_level
    )
    )
    
  3. Dans le volet Duet AI, copiez la requête SQL.

  4. Dans l'éditeur SQL de BigQuery, collez et exécutez la requête SQL.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez supprimer le projet Google Cloud que vous avez créé pour ce tutoriel. Vous pouvez également supprimer les différentes ressources.

  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Supprimer l'ensemble de données

Si vous supprimez votre projet, tous les ensembles de données et toutes les tables qui lui sont associés sont également supprimés. Si vous préférez réutiliser le projet, vous pouvez supprimer l'ensemble de données que vous avez créé dans ce tutoriel.

  1. Dans la console Google Cloud, ouvrez la page BigQuery.

    Accéder à BigQuery

  2. Dans le panneau de navigation, sélectionnez l'ensemble de données bqml_tutorial que vous avez créé.

  3. Pour supprimer l'ensemble de données, la table et toutes les données, cliquez sur Supprimer l'ensemble de données.

  4. Pour confirmer la suppression, dans la boîte de dialogue Supprimer l'ensemble de données, saisissez le nom de votre ensemble de données (bqml_tutorial), puis cliquez sur Supprimer.

Étapes suivantes