Analyser avec le canevas de données BigQuery
Le canevas de données BigQuery Studio, une fonctionnalité de Gemini dans BigQuery, vous permet de rechercher, de transformer, d'interroger et de visualiser des données à l'aide de requêtes en langage naturel et d'une interface graphique pour workflows d'analyse.
Pour les workflows d'analyse, le canevas de données BigQuery utilise un graphe orienté acyclique (DAG), qui fournit une vue graphique de votre workflow. Dans le canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.
Le canevas de données BigQuery est conçu pour accélérer les tâches d'analyse et aider les professionnels des données, tels que les analystes de données, les ingénieurs de données, etc., dans leur parcours d'obtention d'insights à partir de données. Vous n'avez pas besoin de connaissances techniques sur des outils spécifiques, mais seulement d'une connaissance de base de la lecture et de l'écriture en SQL. Le canevas de données BigQuery fonctionne avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.
Le canevas de données BigQuery n'est pas destiné à être utilisé directement par les utilisateurs professionnels.
Les canevas de données BigQuery utilisent Gemini dans BigQuery pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.
Découvrez comment et quand Gemini pour Google Cloud utilise vos données.
Fonctionnalités
Le canevas de données BigQuery vous permet d'effectuer les opérations suivantes :
Utiliser des requêtes en langage naturel ou la syntaxe de recherche de mots clés avec les métadonnées Dataplex pour rechercher des éléments tels que des tables, des vues ou des vues matérialisées.
Utiliser le langage naturel pour les requêtes SQL de base. Par exemple :
- Requêtes contenant des clauses
FROM
, fonctions mathématiques, tableaux et structures. - Opérations
JOIN
pour deux tables.
- Requêtes contenant des clauses
Visualiser les données à l'aide des types de graphiques suivants :
- Graphique à barres
- Carte de densité
- Graphique linéaire
- Graphique à secteurs
- Graphique à nuage de points
Créer des visualisations personnalisées en utilisant le langage naturel pour décrire ce que vous souhaitez.
Automatiser les insights sur les données.
Limites
Les commandes en langage naturel peuvent ne pas fonctionner correctement avec les éléments suivants :
- BigQuery ML
- Apache Spark
- Tables d'objets
- BigLake
INFORMATION_SCHEMA
vues- JSON
- Champs imbriqués et répétés
- Fonctions et types de données complexes, tels que
DATETIME
etTIMEZONE
Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.
Bonnes pratiques concernant les requêtes
Avec les bonnes techniques d'invite, vous pouvez générer des requêtes SQL complexes. Les suggestions suivantes aident le canevas de données BigQuery à affiner vos requêtes en langage naturel pour améliorer la précision de vos requêtes:
Rédigez vos e-mails de manière claire. Formulez votre demande clairement et évitez d'être vague.
Posez des questions directes. Pour obtenir la réponse la plus précise, posez une question à la fois et faites en sorte que vos invites soient concises. Si nécessaire, séparez vos requêtes en différents nœuds dans le canevas de données BigQuery.
Donnez des instructions ciblées et explicites. Mettez en avant les termes clés dans vos invites.
Spécifiez l'ordre des opérations. Fournissez des instructions claires et ordonnées. Divisez les tâches en petites étapes ciblées.
Affinez et itérez. Essayez différentes expressions et approches pour voir ce qui donne les meilleurs résultats.
Pour en savoir plus, consultez les bonnes pratiques d'utilisation des requêtes pour le canevas de données BigQuery.
Avant de commencer
- Assurez-vous que Gemini dans BigQuery est activé pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur.
- Vérifiez que vous disposez des autorisations IAM (Identity and Access Management) nécessaires pour utiliser le canevas de données BigQuery.
Rôles requis
Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
-
Utilisateur BigQuery Studio (
roles/bigquery.studioUser
) -
Utilisateur Gemini pour Google Cloud (
roles/cloudaicompanion.user
)
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.
Utiliser le canevas de données BigQuery
Vous pouvez utiliser le canevas de données BigQuery dans la console Google Cloud, une requête ou une table.
Accédez à la page BigQuery.
Dans l'éditeur de requête, à côté de
Requête SQL, cliquez sur Créer, puis sur Canevas de données.Dans le champ de requête Langage naturel, saisissez une requête en langage naturel.
Par exemple, si vous saisissez
Find me tables related to trees
, le canevas de données BigQuery renvoie une liste de tables possibles, y compris des ensembles de données publics tels quebigquery-public-data.usfs_fia.plot_tree
oubigquery-public-data.new_york_trees.tree_species
.Sélectionnez une table.
Un nœud de table est ajouté pour la table sélectionnée au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.
Essayer des exemples de workflows
Cette section présente différentes façons d'utiliser le canevas de données BigQuery dans les workflows d'analyse.
Exemple de workflow : Rechercher, interroger et visualiser des données
Dans cet exemple, vous allez utiliser des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données, générer une requête et la modifier. Vous devez ensuite créer un graphique.
Requête 1 : Trouver des données
Dans la console Google Cloud, accédez à la page "BigQuery".
Dans l'éditeur de requête, à côté de
Requête SQL, cliquez sur Créer, puis sur Canevas de données.Dans le champ de requête Langage naturel, saisissez la requête en langage naturel suivante :
Chicago taxi trips
Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables.
Sélectionnez la table
bigquery-public-data.chicago_taxi_trips.taxi_trips
, puis cliquez sur Ajouter au canevas.Un nœud de table est ajouté pour
taxi_trips
au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.
Requête 2 : Générer une requête SQL dans la table sélectionnée
Pour générer une requête SQL pour la table bigquery-public-data.chicago_taxi_trips.taxi_trips
, procédez comme suit :
Dans le canevas de données, cliquez sur Requête.
Dans le champ de requête Langage naturel, saisissez les informations suivantes :
Get me the 100 longest trips
Le canevas de données BigQuery génère une requête SQL semblable à la suivante :
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Requête 3 : Modifier la requête
Pour modifier la requête que vous avez générée, vous pouvez modifier manuellement la requête, ou modifier la requête en langage naturel et générer à nouveau la requête. Dans cet exemple, vous utilisez une requête en langage naturel pour modifier la requête afin de ne sélectionner que les trajets pour lesquels le client a payé en espèces.
Dans le champ de requête Langage naturel, saisissez les informations suivantes :
Get me the 100 longest trips where the payment type is cash
Le canevas de données BigQuery génère une requête SQL semblable à la suivante :
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Dans l'exemple précédent,
PROJECT_ID
correspond à l'ID de votre projet Google Cloud.Pour afficher les résultats de la requête, cliquez sur Exécuter.
Créer un graphique
- Dans le canevas de données, cliquez sur Visualiser.
Cliquez sur Créer un graphique à barres.
Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet. Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation.
Facultatif : Effectuez l'une ou plusieurs des opérations suivantes :
- Pour modifier le graphique, cliquez sur Modifier, puis modifiez le graphique dans le volet Modifier la visualisation.
- Pour partager le canevas de données, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.
- Pour nettoyer le canevas de données, sélectionnez Autres actions, puis Effacer le canevas. Cette étape permet d'obtenir un canevas vide.
Exemple de workflow : Joindre des tables
Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données et joindre des tables. Vous allez ensuite exporter une requête sous forme de notebook.
Requête 1 : Trouver des données
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Information about trees
Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres.
Pour cet exemple, sélectionnez la table
bigquery-public-data.new_york_trees.tree_census_1995
, puis cliquez sur Ajouter au canevas.La table s'affiche sur le canevas.
Requête 2 : Joindre les tables sur leur adresse
Sur le canevas de données, cliquez sur Joindre.
Le canevas de données BigQuery suggère des tables à joindre.
Pour ouvrir un nouveau champ de requête Langage naturel, cliquez sur Rechercher des tables.
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Information about trees
Sélectionnez la table
bigquery-public-data.new_york_trees.tree_census_2005
, puis cliquez sur Ajouter au canevas.La table s'affiche sur le canevas.
Sur le canevas de données, cliquez sur Joindre.
Dans la section Sur ce canevas, cochez la case Cellule de table, puis cliquez sur OK.
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Join on address
Le canevas de données BigQuery suggère la requête SQL pour joindre ces deux tables sur leur adresse :
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Pour exécuter la requête et afficher les résultats, cliquez sur Exécuter.
Exporter la requête sous forme de notebook
Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook.
- Dans le canevas de données, cliquez sur Exporter sous forme de notebook.
- Dans le volet Enregistrer le notebook, saisissez le nom du notebook et la région dans laquelle vous souhaitez l'enregistrer.
- Cliquez sur Enregistrer. Le notebook a bien été créé.
- Facultatif : Pour afficher le notebook créé, cliquez sur Ouvrir.
Exemple de workflow : Modifier un graphique à l'aide d'une requête
Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher, interroger et filtrer des données, puis modifier les détails de la visualisation.
Requête 1 : Trouver des données
Pour rechercher des données concernant des noms américains, saisissez la requête suivante :
Find data about USA names
Le canevas de données BigQuery génère une liste de tables.
Pour cet exemple, sélectionnez la table
bigquery-public-data.usa_names.usa_1910_current
, puis cliquez sur Ajouter au canevas.
Requête 2 : Interroger les données
Pour interroger les données, cliquez sur Requête dans le canevas de données, puis saisissez la requête suivante :
Summarize this data
Le canevas de données BigQuery génère une requête semblable à la suivante :
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Cliquez sur Exécuter. Les résultats de la requête s'affichent.
Requête 3 : Filtrer les données
- Dans le canevas de données, cliquez sur Interroger ces résultats.
Pour filtrer les données, saisissez la requête suivante dans le champ de requête SQL :
Get me the top 10 most popular names in 1980
Le canevas de données BigQuery génère une requête semblable à la suivante :
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Lorsque vous exécutez la requête, vous obtenez une table contenant les 10 prénoms d'enfants nés en 1980 les plus populaires.
Créer et modifier un graphique
Dans le canevas de données, cliquez sur Visualiser.
Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée.
Pour cet exemple, cliquez sur Créer un graphique à barres.
Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :
Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.
Requête 4 : Modifier les détails de la visualisation
Dans le champ de requête Visualisation, saisissez les éléments suivants :
Create a bar chart sorted high to low, with a gradient
Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :
Facultatif : Pour apporter des modifications supplémentaires, cliquez sur Modifier.
Le volet Modifier la visualisation s'affiche. Vous pouvez modifier des détails tels que le titre du graphique, le nom de l'axe des abscisses et le nom de l'axe des ordonnées. De plus, si vous cliquez sur l'onglet Éditeur JSON, vous pouvez modifier directement le graphique en fonction des valeurs JSON.
Afficher tous les canevas de données
Pour afficher la liste de tous les canevas de données de votre projet, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur
Afficher les actions à côté de Canevas de données, puis effectuez l'une des opérations suivantes:
- Pour ouvrir la liste dans l'onglet actuel, cliquez sur Tout afficher.
- Pour ouvrir la liste dans un nouvel onglet, cliquez sur Tout afficher dans > Nouvel onglet.
- Pour ouvrir la liste dans un onglet divisé, cliquez sur Tout afficher dans> Diviser l'onglet.
Afficher les métadonnées du canevas de données
Pour afficher les métadonnées du canevas de données, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données pour lequel vous souhaitez afficher les métadonnées.
Consultez le volet Résumé pour afficher des informations sur le canevas de données, telles que la région qu'il utilise et la date de sa dernière modification.
Utiliser les versions du canevas de données
Vous pouvez afficher, comparer et restaurer des versions d'un canevas de données.
Afficher et comparer les versions du canevas de données
Pour afficher différentes versions d'un canevas de données et les comparer à la version actuelle, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données pour lequel vous souhaitez afficher l'activité.
Cliquez sur l'onglet Activité pour afficher la liste des versions du canevas de données par ordre décroissant de date.
Cliquez sur
Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la version actuelle du canevas de données.(Facultatif) Pour comparer les versions de manière intégrée plutôt que dans des volets distincts, cliquez sur Comparer, puis sur Intégré.
Restaurer une version d'un canevas de données
Utilisez l'une des options suivantes pour restaurer une version d'un canevas de données. La restauration à partir du volet de comparaison vous permet de comparer la version précédente du canevas de données à la version actuelle avant de la restaurer.
Volet Activité
- Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
- Sélectionnez le volet Activité.
- Cliquez sur Afficher les actions à côté de la version du canevas de données que vous souhaitez restaurer, puis sur Restaurer.
- Cliquez sur Confirmer pour confirmer l'action.
Volet Comparaison
- Dans le volet Explorer, développez votre projet et le dossier Canevas de données, et, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
- Sélectionnez le volet Activité.
- Cliquez sur Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la dernière version du canevas de données.
- Si vous souhaitez restaurer la version précédente du canevas de données après la comparaison, cliquez sur Restaurer.
- Cliquez sur Confirmer pour confirmer l'action.
Tarifs
Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.
Quotas et limites
Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.
Fournir des commentaires
Vous pouvez nous aider à améliorer les suggestions du canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :
Dans la barre d'outils de la console Google Cloud, cliquez sur Envoyer des commentaires.
Facultatif : Pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires, cliquez sur
Copier.Pour remplir le formulaire et nous faire part de vos commentaires, cliquez sur Formulaire.
Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable
et serviceusage.services.list
. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.
Pour nous faire directement part de vos commentaires sur cette fonctionnalité, vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com.
Étapes suivantes
Découvrez comment écrire des requêtes avec l'assistance Gemini.
Apprenez à créer des notebooks.