Analyser avec le canevas de données BigQuery
Pour envoyer des commentaires ou demander de l'aide concernant les canevas de données BigQuery Studio, envoyez un e-mail à l'adresse datacanvas-feedback@google.com.
Le canevas de données BigQuery Studio, une fonctionnalité de Gemini dans BigQuery, vous permet de rechercher, de transformer, d'interroger et de visualiser des données à l'aide de requêtes en langage naturel et d'une interface graphique pour workflows d'analyse.
Pour les workflows d'analyse, le canevas de données BigQuery utilise un graphe orienté acyclique (DAG), qui fournit une vue graphique de votre workflow. Dans le canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.
Le canevas de données BigQuery est conçu pour vous aider dans votre parcours d'obtention d'insights à partir de données. Vous pouvez travailler avec des données sans avoir besoin de connaissances techniques sur des outils ou produits spécifiques. Le canevas de données BigQuery fonctionne avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.
Les canevas de données BigQuery utilisent Gemini dans BigQuery pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.
Découvrez comment et quand Gemini pour Google Cloud utilise vos données.
Fonctionnalités
Le canevas de données BigQuery vous permet d'effectuer les opérations suivantes :
Utiliser la syntaxe de recherche de mots clés avec les métadonnées Dataplex pour rechercher des éléments tels que des tables, des vues ou des vues matérialisées.
Utiliser le langage naturel pour les requêtes SQL de base. Par exemple :
- Requêtes contenant des clauses
FROM
, fonctions mathématiques, tableaux et structures. - Opérations
JOIN
pour deux tables.
- Requêtes contenant des clauses
Visualiser les données à l'aide des types de graphiques suivants :
- Graphique à barres
- Carte de densité
- Graphique linéaire
- Graphique à secteurs
- Graphique à nuage de points
Créer des visualisations personnalisées en utilisant le langage naturel pour décrire ce que vous souhaitez.
Automatiser les insights sur les données.
Limites
Les commandes en langage naturel peuvent ne pas fonctionner correctement avec les éléments suivants :
- BigQuery ML
- Apache Spark
- Tables d'objets
- BigLake
INFORMATION_SCHEMA
vues- JSON
- Champs imbriqués et répétés
- Fonctions et types de données complexes, tels que
DATETIME
etTIMEZONE
Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.
Avant de commencer
- Assurez-vous que Gemini dans BigQuery est activé pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur.
- Vérifiez que vous disposez des autorisations IAM (Identity and Access Management) nécessaires pour utiliser le canevas de données BigQuery.
Rôles requis
Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
-
Utilisateur BigQuery Studio (
roles/bigquery.studioUser
) -
Utilisateur de Cloud AI Companion (
roles/cloudaicompanion.user
)
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.
Utiliser le canevas de données BigQuery
Vous pouvez utiliser le canevas de données BigQuery dans la console Google Cloud, une requête ou une table.
Accédez à la page BigQuery.
Cliquez sur
Créer un canevas de données.Dans le champ de requête Langage naturel, saisissez une requête en langage naturel.
Par exemple, si vous saisissez
Find me tables related to trees
, le canevas de données BigQuery renvoie une liste de tables possibles, y compris des ensembles de données publics tels quebigquery-public-data.usfs_fia.plot_tree
oubigquery-public-data.new_york_trees.tree_species
.Sélectionnez une table.
Un nœud de table est ajouté pour la table sélectionnée au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.
Essayer des exemples de workflows
Cette section présente différentes façons d'utiliser le canevas de données BigQuery dans les workflows d'analyse.
Exemple de workflow : Rechercher, interroger et visualiser des données
Dans cet exemple, vous allez utiliser des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données, générer une requête et la modifier. Vous devez ensuite créer un graphique.
Requête 1 : Trouver des données
Dans la console Google Cloud, accédez à la page BigQuery.
Cliquez sur
Créer un canevas de données.Dans le champ de requête Langage naturel, saisissez la requête en langage naturel suivante :
Chicago taxi trips
Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables.
Sélectionnez la table
bigquery-public-data.chicago_taxi_trips.taxi_trips
, puis cliquez sur Ajouter au canevas.Un nœud de table est ajouté pour
taxi_trips
au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.
Requête 2 : Générer une requête SQL dans la table sélectionnée
Pour générer une requête SQL pour la table bigquery-public-data.chicago_taxi_trips.taxi_trips
, procédez comme suit :
Dans le canevas de données, cliquez sur Requête.
Dans le champ de requête Langage naturel, saisissez les informations suivantes :
Get me the 100 longest trips
Le canevas de données BigQuery génère une requête SQL semblable à la suivante :
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Requête 3 : Modifier la requête
Pour modifier la requête que vous avez générée, vous pouvez modifier manuellement la requête, ou modifier la requête en langage naturel et générer à nouveau la requête. Dans cet exemple, vous utilisez une requête en langage naturel pour modifier la requête afin de ne sélectionner que les trajets pour lesquels le client a payé en espèces.
Dans le champ de requête Langage naturel, saisissez les informations suivantes :
Get me the 100 longest trips where the payment type is cash
Le canevas de données BigQuery génère une requête SQL semblable à la suivante :
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Dans l'exemple précédent,
PROJECT_ID
correspond à l'ID de votre projet Google Cloud.Pour afficher les résultats de la requête, cliquez sur Exécuter.
Créer un graphique
- Dans le canevas de données, cliquez sur Visualiser.
Cliquez sur Créer un graphique à barres.
Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet. Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation.
Facultatif : Effectuez l'une ou plusieurs des opérations suivantes :
- Pour modifier le graphique, cliquez sur Modifier, puis modifiez le graphique dans le volet Modifier la visualisation.
- Pour partager le canevas de données, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.
- Pour nettoyer le canevas de données, sélectionnez more_vert Autres actions, puis more_vert Effacer le canevas. Cette étape permet d'obtenir un canevas vide.
Exemple de workflow : Joindre des tables
Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données et joindre des tables. Vous allez ensuite exporter une requête sous forme de notebook.
Requête 1 : Trouver des données
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Information about trees
Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres.
Pour cet exemple, sélectionnez la table
bigquery-public-data.new_york_trees.tree_census_1995
, puis cliquez sur Ajouter au canevas.La table s'affiche sur le canevas.
Requête 2 : Joindre les tables sur leur adresse
Sur le canevas de données, cliquez sur Joindre.
Le canevas de données BigQuery suggère des tables à joindre.
Pour ouvrir un nouveau champ de requête Langage naturel, cliquez sur Rechercher des tables.
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Information about trees
Sélectionnez la table
bigquery-public-data.new_york_trees.tree_census_2005
, puis cliquez sur Ajouter au canevas.La table s'affiche sur le canevas.
Sur le canevas de données, cliquez sur Joindre.
Dans la section Sur ce canevas, cochez la case Cellule de table, puis cliquez sur OK.
Dans le champ de requête Langage naturel, saisissez la requête suivante :
Join on address
Le canevas de données BigQuery suggère la requête SQL pour joindre ces deux tables sur leur adresse :
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Pour exécuter la requête et afficher les résultats, cliquez sur Exécuter.
Exporter la requête sous forme de notebook
Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook.
- Dans le canevas de données, cliquez sur Exporter sous forme de notebook.
- Dans le volet Enregistrer le notebook, saisissez le nom du notebook et la région dans laquelle vous souhaitez l'enregistrer.
- Cliquez sur Enregistrer. Le notebook a bien été créé.
- Facultatif : Pour afficher le notebook créé, cliquez sur Ouvrir.
Exemple de workflow : Modifier un graphique à l'aide d'une requête
Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher, interroger et filtrer des données, puis modifier les détails de la visualisation.
Requête 1 : Trouver des données
Pour rechercher des données concernant des noms américains, saisissez la requête suivante :
Find data about USA names
Le canevas de données BigQuery génère une liste de tables.
Pour cet exemple, sélectionnez la table
bigquery-public-data.usa_names.usa_1910_current
, puis cliquez sur Ajouter au canevas.
Requête 2 : Interroger les données
Pour interroger les données, cliquez sur Requête dans le canevas de données, puis saisissez la requête suivante :
Summarize this data
Le canevas de données BigQuery génère une requête semblable à la suivante :
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Cliquez sur Exécuter. Les résultats de la requête s'affichent.
Requête 3 : Filtrer les données
- Dans le canevas de données, cliquez sur Interroger ces résultats.
Pour filtrer les données, saisissez la requête suivante dans le champ de requête SQL :
Get me the top 10 most popular names in 1980
Le canevas de données BigQuery génère une requête semblable à la suivante :
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Lorsque vous exécutez la requête, vous obtenez une table contenant les 10 prénoms d'enfants nés en 1980 les plus populaires.
Créer et modifier un graphique
Dans le canevas de données, cliquez sur Visualiser.
Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée.
Pour cet exemple, cliquez sur Créer un graphique à barres.
Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :
Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.
Requête 4 : Modifier les détails de la visualisation
Dans le champ de requête Visualisation, saisissez les éléments suivants :
Create a bar chart sorted high to low, with a gradient
Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :
Facultatif : Pour apporter des modifications supplémentaires, cliquez sur Modifier.
Le volet Modifier la visualisation s'affiche. Vous pouvez modifier des détails tels que le titre du graphique, le nom de l'axe des abscisses et le nom de l'axe des ordonnées. De plus, si vous cliquez sur l'onglet Éditeur JSON, vous pouvez modifier directement le graphique en fonction des valeurs JSON.
Tarifs
Vous êtes facturé en fonction du modèle de tarification basé sur le calcul ou le stockage lorsque vous utilisez le canevas de données BigQuery. L'utilisation de Gemini avec le canevas de données BigQuery pendant la version bêta n'entraîne aucuns frais supplémentaires.
Envoyer des commentaires
Vous pouvez nous aider à améliorer les suggestions du canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :
Dans la barre d'outils de la console Google Cloud, cliquez sur Envoyer des commentaires.
Facultatif : Pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires, cliquez sur
Copier.Pour remplir le formulaire et nous faire part de vos commentaires, cliquez sur Formulaire.
Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable
et serviceusage.services.list
. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.
Pour nous faire directement part de vos commentaires sur cette fonctionnalité, vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com.
Étapes suivantes
Découvrez comment écrire des requêtes avec l'assistance Gemini.
Apprenez à créer des notebooks.