Analyser avec le canevas de données BigQuery

Le canevas de données BigQuery Studio, une fonctionnalité de Gemini dans BigQuery, vous permet de rechercher, de transformer, d'interroger et de visualiser des données à l'aide de requêtes en langage naturel et d'une interface graphique pour workflows d'analyse.

Pour les workflows d'analyse, le canevas de données BigQuery utilise un graphe orienté acyclique (DAG), qui fournit une vue graphique de votre workflow. Dans le canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.

Le canevas de données BigQuery est conçu pour accélérer les tâches d'analyse et aider les professionnels des données, tels que les analystes de données, les ingénieurs de données, etc., dans leur parcours d'obtention d'insights à partir de données. Vous n'avez pas besoin de connaissances techniques sur des outils spécifiques, mais seulement d'une connaissance de base de la lecture et de l'écriture en SQL. Le canevas de données BigQuery fonctionne avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.

Le canevas de données BigQuery n'est pas destiné à être utilisé directement par les utilisateurs professionnels.

Les canevas de données BigQuery utilisent Gemini dans BigQuery pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.

Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

Fonctionnalités

Le canevas de données BigQuery vous permet d'effectuer les opérations suivantes :

  • Utiliser des requêtes en langage naturel ou la syntaxe de recherche de mots clés avec les métadonnées Dataplex pour rechercher des éléments tels que des tables, des vues ou des vues matérialisées.

  • Utiliser le langage naturel pour les requêtes SQL de base. Par exemple :

    • Requêtes contenant des clauses FROM, fonctions mathématiques, tableaux et structures.
    • Opérations JOIN pour deux tables.
  • Visualiser les données à l'aide des types de graphiques suivants :

    • Graphique à barres
    • Carte de densité
    • Graphique linéaire
    • Graphique à secteurs
    • Graphique à nuage de points
  • Créer des visualisations personnalisées en utilisant le langage naturel pour décrire ce que vous souhaitez.

  • Automatiser les insights sur les données.

Limites

  • Les commandes en langage naturel peuvent ne pas fonctionner correctement avec les éléments suivants :

    • BigQuery ML
    • Apache Spark
    • Tables d'objets
    • BigLake
    • INFORMATION_SCHEMA vues
    • JSON
    • Champs imbriqués et répétés
    • Fonctions et types de données complexes, tels que DATETIME et TIMEZONE
  • Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.

Bonnes pratiques concernant les requêtes

Avec les bonnes techniques d'invite, vous pouvez générer des requêtes SQL complexes. Les suggestions suivantes aident le canevas de données BigQuery à affiner vos requêtes en langage naturel pour améliorer la précision de vos requêtes:

  • Rédigez vos e-mails de manière claire. Formulez votre demande clairement et évitez d'être vague.

  • Posez des questions directes. Pour obtenir la réponse la plus précise, posez une question à la fois et faites en sorte que vos invites soient concises. Si nécessaire, séparez vos requêtes en différents nœuds dans le canevas de données BigQuery.

  • Donnez des instructions ciblées et explicites. Mettez en avant les termes clés dans vos invites.

  • Spécifiez l'ordre des opérations. Fournissez des instructions claires et ordonnées. Divisez les tâches en petites étapes ciblées.

  • Affinez et itérez. Essayez différentes expressions et approches pour voir ce qui donne les meilleurs résultats.

Pour en savoir plus, consultez les bonnes pratiques d'utilisation des requêtes pour le canevas de données BigQuery.

Avant de commencer

  1. Assurez-vous que Gemini dans BigQuery est activé pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur.
  2. Vérifiez que vous disposez des autorisations IAM (Identity and Access Management) nécessaires pour utiliser le canevas de données BigQuery.

Rôles requis

Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.

Utiliser le canevas de données BigQuery

Vous pouvez utiliser le canevas de données BigQuery dans la console Google Cloud, une requête ou une table.

  1. Accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans l'éditeur de requête, à côté de Requête SQL, cliquez sur Créer, puis sur Canevas de données.

    Icône Créer un canevas de données.

  3. Dans le champ de requête Langage naturel, saisissez une requête en langage naturel.

    Par exemple, si vous saisissez Find me tables related to trees, le canevas de données BigQuery renvoie une liste de tables possibles, y compris des ensembles de données publics tels que bigquery-public-data.usfs_fia.plot_tree ou bigquery-public-data.new_york_trees.tree_species.

  4. Sélectionnez une table.

    Un nœud de table est ajouté pour la table sélectionnée au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.

Essayer des exemples de workflows

Cette section présente différentes façons d'utiliser le canevas de données BigQuery dans les workflows d'analyse.

Exemple de workflow : Rechercher, interroger et visualiser des données

Dans cet exemple, vous allez utiliser des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données, générer une requête et la modifier. Vous devez ensuite créer un graphique.

Requête 1 : Trouver des données

  1. Dans la console Google Cloud, accédez à la page "BigQuery".

    Accéder à BigQuery

  2. Dans l'éditeur de requête, à côté de Requête SQL, cliquez sur Créer, puis sur Canevas de données.

    Icône Créer un canevas de données.

  3. Dans le champ de requête Langage naturel, saisissez la requête en langage naturel suivante :

    Chicago taxi trips
    

    Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables.

  4. Sélectionnez la table bigquery-public-data.chicago_taxi_trips.taxi_trips, puis cliquez sur Ajouter au canevas.

    Un nœud de table est ajouté pour taxi_trips au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.

Requête 2 : Générer une requête SQL dans la table sélectionnée

Pour générer une requête SQL pour la table bigquery-public-data.chicago_taxi_trips.taxi_trips, procédez comme suit :

  1. Dans le canevas de données, cliquez sur Requête.

  2. Dans le champ de requête Langage naturel, saisissez les informations suivantes :

    Get me the 100 longest trips
    

    Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Requête 3 : Modifier la requête

Pour modifier la requête que vous avez générée, vous pouvez modifier manuellement la requête, ou modifier la requête en langage naturel et générer à nouveau la requête. Dans cet exemple, vous utilisez une requête en langage naturel pour modifier la requête afin de ne sélectionner que les trajets pour lesquels le client a payé en espèces.

  1. Dans le champ de requête Langage naturel, saisissez les informations suivantes :

    Get me the 100 longest trips where the payment type is cash
    

    Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Dans l'exemple précédent, PROJECT_ID correspond à l'ID de votre projet Google Cloud.

  2. Pour afficher les résultats de la requête, cliquez sur Exécuter.

Créer un graphique

  1. Dans le canevas de données, cliquez sur Visualiser.
  2. Cliquez sur Créer un graphique à barres.

    Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet. Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation.

  3. Facultatif : Effectuez l'une ou plusieurs des opérations suivantes :

    • Pour modifier le graphique, cliquez sur Modifier, puis modifiez le graphique dans le volet Modifier la visualisation.
    • Pour partager le canevas de données, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.
    • Pour nettoyer le canevas de données, sélectionnez Autres actions, puis Effacer le canevas. Cette étape permet d'obtenir un canevas vide.

Exemple de workflow : Joindre des tables

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données et joindre des tables. Vous allez ensuite exporter une requête sous forme de notebook.

Requête 1 : Trouver des données

  1. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Information about trees
    

    Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres.

  2. Pour cet exemple, sélectionnez la table bigquery-public-data.new_york_trees.tree_census_1995, puis cliquez sur Ajouter au canevas.

    La table s'affiche sur le canevas.

Requête 2 : Joindre les tables sur leur adresse

  1. Sur le canevas de données, cliquez sur Joindre.

    Le canevas de données BigQuery suggère des tables à joindre.

  2. Pour ouvrir un nouveau champ de requête Langage naturel, cliquez sur Rechercher des tables.

  3. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Information about trees
    
  4. Sélectionnez la table bigquery-public-data.new_york_trees.tree_census_2005, puis cliquez sur Ajouter au canevas.

    La table s'affiche sur le canevas.

  5. Sur le canevas de données, cliquez sur Joindre.

  6. Dans la section Sur ce canevas, cochez la case Cellule de table, puis cliquez sur OK.

  7. Dans le champ de requête Langage naturel, saisissez la requête suivante :

    Join on address
    

    Le canevas de données BigQuery suggère la requête SQL pour joindre ces deux tables sur leur adresse :

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Pour exécuter la requête et afficher les résultats, cliquez sur Exécuter.

Exporter la requête sous forme de notebook

Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook.

  1. Dans le canevas de données, cliquez sur Exporter sous forme de notebook.
  2. Dans le volet Enregistrer le notebook, saisissez le nom du notebook et la région dans laquelle vous souhaitez l'enregistrer.
  3. Cliquez sur Enregistrer. Le notebook a bien été créé.
  4. Facultatif : Pour afficher le notebook créé, cliquez sur Ouvrir.

Exemple de workflow : Modifier un graphique à l'aide d'une requête

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher, interroger et filtrer des données, puis modifier les détails de la visualisation.

Requête 1 : Trouver des données

  1. Pour rechercher des données concernant des noms américains, saisissez la requête suivante :

    Find data about USA names
    

    Le canevas de données BigQuery génère une liste de tables.

  2. Pour cet exemple, sélectionnez la table bigquery-public-data.usa_names.usa_1910_current, puis cliquez sur Ajouter au canevas.

Requête 2 : Interroger les données

  1. Pour interroger les données, cliquez sur Requête dans le canevas de données, puis saisissez la requête suivante :

    Summarize this data
    

    Le canevas de données BigQuery génère une requête semblable à la suivante :

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Cliquez sur Exécuter. Les résultats de la requête s'affichent.

Requête 3 : Filtrer les données

  1. Dans le canevas de données, cliquez sur Interroger ces résultats.
  2. Pour filtrer les données, saisissez la requête suivante dans le champ de requête SQL :

    Get me the top 10 most popular names in 1980
    

    Le canevas de données BigQuery génère une requête semblable à la suivante :

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Lorsque vous exécutez la requête, vous obtenez une table contenant les 10 prénoms d'enfants nés en 1980 les plus populaires.

Créer et modifier un graphique

  1. Dans le canevas de données, cliquez sur Visualiser.

    Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée.

  2. Pour cet exemple, cliquez sur Créer un graphique à barres.

    Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

    Graphique à barres des 10 noms les plus utilisés.

Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.

Requête 4 : Modifier les détails de la visualisation

  1. Dans le champ de requête Visualisation, saisissez les éléments suivants :

    Create a bar chart sorted high to low, with a gradient
    

    Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

    Graphique à barres trié des 10 noms les plus utilisés

  2. Facultatif : Pour apporter des modifications supplémentaires, cliquez sur Modifier.

    Le volet Modifier la visualisation s'affiche. Vous pouvez modifier des détails tels que le titre du graphique, le nom de l'axe des abscisses et le nom de l'axe des ordonnées. De plus, si vous cliquez sur l'onglet Éditeur JSON, vous pouvez modifier directement le graphique en fonction des valeurs JSON.

Afficher tous les canevas de données

Pour afficher la liste de tous les canevas de données de votre projet, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le volet Explorateur, cliquez sur Afficher les actions à côté de Canevas de données, puis effectuez l'une des opérations suivantes:

  • Pour ouvrir la liste dans l'onglet actuel, cliquez sur Tout afficher.
  • Pour ouvrir la liste dans un nouvel onglet, cliquez sur Tout afficher dans > Nouvel onglet.
  • Pour ouvrir la liste dans un onglet divisé, cliquez sur Tout afficher dans> Diviser l'onglet.

Afficher les métadonnées du canevas de données

Pour afficher les métadonnées du canevas de données, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données pour lequel vous souhaitez afficher les métadonnées.

  3. Consultez le volet Résumé pour afficher des informations sur le canevas de données, telles que la région qu'il utilise et la date de sa dernière modification.

Utiliser les versions du canevas de données

Vous pouvez afficher, comparer et restaurer des versions d'un canevas de données.

Afficher et comparer les versions du canevas de données

Pour afficher différentes versions d'un canevas de données et les comparer à la version actuelle, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données pour lequel vous souhaitez afficher l'activité.

  3. Cliquez sur l'onglet Activité pour afficher la liste des versions du canevas de données par ordre décroissant de date.

  4. Cliquez sur Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la version actuelle du canevas de données.

  5. (Facultatif) Pour comparer les versions de manière intégrée plutôt que dans des volets distincts, cliquez sur Comparer, puis sur Intégré.

Restaurer une version d'un canevas de données

Utilisez l'une des options suivantes pour restaurer une version d'un canevas de données. La restauration à partir du volet de comparaison vous permet de comparer la version précédente du canevas de données à la version actuelle avant de la restaurer.

Volet Activité

  1. Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
  2. Sélectionnez le volet Activité.
  3. Cliquez sur Afficher les actions à côté de la version du canevas de données que vous souhaitez restaurer, puis sur Restaurer.
  4. Cliquez sur Confirmer pour confirmer l'action.

Volet Comparaison

  1. Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
  2. Sélectionnez le volet Activité.
  3. Cliquez sur Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la dernière version du canevas de données.
  4. Si vous souhaitez restaurer la version précédente du canevas de données après la comparaison, cliquez sur Restaurer.
  5. Cliquez sur Confirmer pour confirmer l'action.

Tarifs

Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.

Quotas et limites

Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.

Fournir des commentaires

Vous pouvez nous aider à améliorer les suggestions du canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :

  1. Dans la barre d'outils de la console Google Cloud, cliquez sur Envoyer des commentaires.

  2. Facultatif : Pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires, cliquez sur Copier.

  3. Pour remplir le formulaire et nous faire part de vos commentaires, cliquez sur Formulaire.

Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable et serviceusage.services.list. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.

Pour nous faire directement part de vos commentaires sur cette fonctionnalité, vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com.

Étapes suivantes