Analyser avec le canevas de données BigQuery

Pour envoyer des commentaires ou demander de l'aide concernant les canevas de données BigQuery Studio, envoyez un e-mail à l'adresse datacanvas-feedback@google.com.

Le canevas de données BigQuery Studio, une fonctionnalité de Gemini dans BigQuery, vous permet de rechercher, de transformer, d'interroger et de visualiser des données à l'aide de requêtes en langage naturel et d'une interface graphique pour workflows d'analyse.

Pour les workflows d'analyse, le canevas de données BigQuery utilise un graphe orienté acyclique (DAG), qui fournit une vue graphique de votre workflow. Dans le canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.

Le canevas de données BigQuery est conçu pour vous aider dans votre parcours d'obtention d'insights à partir de données. Vous pouvez travailler avec des données sans avoir besoin de connaissances techniques sur des outils ou produits spécifiques. Le canevas de données BigQuery fonctionne avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.

Les canevas de données BigQuery utilisent Gemini dans BigQuery pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.

Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

Capacités

Le canevas de données BigQuery vous permet d'effectuer les opérations suivantes :

  • Utiliser la syntaxe de recherche de mots clés avec les métadonnées Dataplex pour rechercher des éléments tels que des tables, des vues ou des vues matérialisées.

  • Utiliser le langage naturel pour les requêtes SQL de base. Par exemple :

    • Requêtes contenant des clauses FROM, fonctions mathématiques, tableaux et structures.
    • Opérations JOIN pour deux tables.
  • Visualiser les données à l'aide des types de graphiques suivants :

    • Graphique à barres
    • Carte thermique
    • Graphique linéaire
    • Graphique à secteurs
    • Graphique à nuages de points
  • Créer des visualisations personnalisées en utilisant le langage naturel pour décrire ce que vous souhaitez.

  • Automatiser les insights sur les données.

Limites

  • Les commandes en langage naturel peuvent ne pas fonctionner correctement avec les éléments suivants :

    • BigQuery ML
    • Apache Spark
    • Tables d'objets
    • BigLake
    • Vues INFORMATION_SCHEMA
    • JSON
    • Champs imbriqués et répétés
    • Fonctions et types de données complexes, tels que DATETIME et TIMEZONE
  • Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.

Avant de commencer

  1. Assurez-vous que Gemini dans BigQuery est activé pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur.
  2. Vérifiez que vous disposez des autorisations IAM (Identity and Access Management) nécessaires pour utiliser le canevas de données BigQuery.

Rôles requis

Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.

Utiliser le canevas de données BigQuery

Vous pouvez utiliser le canevas de données BigQuery dans la console Google Cloud, une requête ou une table.

  1. Accédez à la page BigQuery.

    Accéder à BigQuery

  2. Cliquez sur Créer un canevas de données.

    Icône Créer un canevas de données.

  3. Dans le champ de requête Langage naturel, saisissez une requête en langage naturel.

    Par exemple, si vous saisissez Find me tables related to trees, le canevas de données BigQuery renvoie une liste de tables possibles, y compris des ensembles de données publics tels que bigquery-public-data.usfs_fia.plot_tree ou bigquery-public-data.new_york_trees.tree_species.

  4. Sélectionnez une table.

    Une cellule de table est ajoutée pour la table sélectionnée au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets de la cellule de table.

Essayer des exemples de workflows

Cette section présente différentes façons d'utiliser le canevas de données BigQuery dans les workflows d'analyse.

Exemple de workflow : Rechercher, interroger et visualiser des données

Dans cet exemple, vous allez utiliser des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données, générer une requête et la modifier. Vous devez ensuite créer un graphique.

Requête 1 : Trouver des données

  1. Dans la console Google Cloud, accédez à la page "BigQuery".

    Accéder à BigQuery

  2. Cliquez sur Créer un canevas de données.

    Icône Créer un canevas de données.

  3. Dans le champ de requête Langage naturel, saisissez la requête en langage naturel suivante :

    Chicago taxi trips
    

    Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables.

  4. Sélectionnez la table bigquery-public-data.chicago_taxi_trips.taxi_trips, puis cliquez sur Ajouter au canevas.

    Une cellule de table est ajoutée pour taxi_trips au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets de la cellule de table.

Requête 2 : Générer une requête SQL dans la table sélectionnée

Pour générer une requête SQL pour la table bigquery-public-data.chicago_taxi_trips.taxi_trips, procédez comme suit :

  1. Dans le canevas de données, cliquez sur Requête.

  2. Dans le champ de requête Langage naturel, saisissez les informations suivantes :

    Get me the 100 longest trips
    

    Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;
    

Requête 3 : Modifier la requête

Pour modifier la requête que vous avez générée, vous pouvez modifier manuellement la requête, ou modifier la requête en langage naturel et générer à nouveau la requête. Dans cet exemple, vous utilisez une requête en langage naturel pour modifier la requête afin de ne sélectionner que les trajets pour lesquels le client a payé en espèces.

  1. Dans le champ de requête Langage naturel, saisissez les informations suivantes :

    Get me the 100 longest trips where the payment type is cash
    

    Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;
    

    Dans l'exemple précédent, PROJECT_ID correspond à l'ID de votre projet Google Cloud.

  2. Pour afficher les résultats de la requête, cliquez sur Exécuter.

Créer un graphique

  1. Dans le canevas de données, cliquez sur Visualiser.
  2. Cliquez sur Créer un graphique à barres.

    Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet. Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation.

  3. Facultatif : Effectuez l'une ou plusieurs des opérations suivantes :

    • Pour modifier le graphique, cliquez sur Modifier, puis modifiez le graphique dans le volet Modifier la visualisation.
    • Pour partager le canevas de données, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.
    • Pour nettoyer le canevas de données, sélectionnez more_vert Autres actions, puis gavel Effacer le canevas. Cette étape permet d'obtenir un canevas vide.

Exemple de workflow : Joindre des tables

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données et joindre des tables. Vous allez ensuite exporter une requête sous forme de notebook.

Requête 1 : Trouver des données

  1. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Information about trees
    

    Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres.

  2. Pour cet exemple, sélectionnez la table bigquery-public-data.new_york_trees.tree_census_1995, puis cliquez sur Ajouter au canevas.

    La table s'affiche sur le canevas.

Requête 2 : Joindre les tables sur leur adresse

  1. Sur le canevas de données, cliquez sur Joindre.

    Le canevas de données BigQuery suggère des tables à joindre.

  2. Pour ouvrir un nouveau champ de requête Langage naturel, cliquez sur Rechercher des tables.

  3. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Information about trees
    
  4. Sélectionnez la table bigquery-public-data.new_york_trees.tree_census_2005, puis cliquez sur Ajouter au canevas.

    La table s'affiche sur le canevas.

  5. Sur le canevas de données, cliquez sur Joindre.

  6. Dans la section Sur ce canevas, cochez la case Cellule de table, puis cliquez sur OK.

  7. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Join on address
    

    Le canevas de données BigQuery suggère la requête SQL pour joindre ces deux tables sur leur adresse :

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
    
  8. Pour exécuter la requête et afficher les résultats, cliquez sur Exécuter.

Exporter la requête sous forme de notebook

Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook.

  1. Dans le canevas de données, cliquez sur Exporter sous forme de notebook.
  2. Dans le volet Enregistrer le notebook, saisissez le nom du notebook et la région dans laquelle vous souhaitez l'enregistrer.
  3. Cliquez sur Enregistrer. Le notebook a bien été créé.
  4. Facultatif : Pour afficher le notebook créé, cliquez sur Ouvrir.

Exemple de workflow : Modifier un graphique à l'aide d'une requête

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher, interroger et filtrer des données, puis modifier les détails de la visualisation.

Requête 1 : Trouver des données

  1. Pour rechercher des données concernant des noms américains, saisissez la requête suivante :

    Find data about USA names
    

    Le canevas de données BigQuery génère une liste de tables.

  2. Pour cet exemple, sélectionnez la table bigquery-public-data.usa_names.usa_1910_current, puis cliquez sur Ajouter au canevas.

Requête 2 : Interroger les données

  1. Pour interroger les données, cliquez sur Requête dans le canevas de données, puis saisissez la requête suivante :

    Summarize this data
    

    Le canevas de données BigQuery génère une requête semblable à la suivante :

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
    
  2. Cliquez sur Exécuter. Les résultats de la requête s'affichent.

Requête 3 : Filtrer les données

  1. Dans le canevas de données, cliquez sur Interroger ces résultats.
  2. Pour filtrer les données, saisissez la requête suivante dans le champ de requête SQL :

    Get me the top 10 most popular names in 1980
    

    Le canevas de données BigQuery génère une requête semblable à la suivante :

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;
    

    Lorsque vous exécutez la requête, vous obtenez une table contenant les 10 prénoms d'enfants nés en 1980 les plus populaires.

Requête 4 : Créer et modifier un graphique

  1. Dans le canevas de données, cliquez sur Visualiser.

    Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée.

  2. Pour cet exemple, cliquez sur Créer un graphique à barres.

    Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

    Graphique à barres des 10 noms les plus utilisés.

Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.

Requête 5 : Modifier les détails de la visualisation

  1. Dans le champ de requête Visualisation, saisissez les éléments suivants :

    Create a bar chart sorted high to low, with a gradient
    

    Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

    Graphique à barres trié des 10 noms les plus utilisés

  2. Facultatif : Pour apporter des modifications supplémentaires, cliquez sur Modifier.

    Le volet Modifier la visualisation s'affiche. Vous pouvez modifier des détails tels que le titre du graphique, le nom de l'axe des abscisses et le nom de l'axe des ordonnées. De plus, si vous cliquez sur l'onglet Éditeur JSON, vous pouvez modifier directement le graphique en fonction des valeurs JSON.

Tarification

Vous êtes facturé en fonction du modèle de tarification basé sur le calcul ou le stockage lorsque vous utilisez le canevas de données BigQuery. L'utilisation de Gemini avec le canevas de données BigQuery pendant la version bêta n'entraîne aucuns frais supplémentaires.

Fournir des commentaires

Vous pouvez nous aider à améliorer les suggestions du canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :

  1. Dans la barre d'outils de la console Google Cloud, cliquez sur Envoyer des commentaires.

  2. Facultatif : Pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires, cliquez sur Copier.

  3. Pour remplir le formulaire et nous faire part de vos commentaires, cliquez sur Formulaire.

Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable et serviceusage.services.list. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.

Pour nous faire directement part de vos commentaires sur cette fonctionnalité, vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com.

Étapes suivantes