Analyser avec le canevas de données BigQuery

Le canevas de données BigQuery Studio, une fonctionnalité de Gemini dans BigQuery, vous permet de rechercher, de transformer, d'interroger et de visualiser des données à l'aide de requêtes en langage naturel et d'une interface graphique pour workflows d'analyse.

Pour les workflows d'analyse, le canevas de données BigQuery utilise un graphe orienté acyclique (DAG), qui fournit une vue graphique de votre workflow. Dans le canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.

Le canevas de données BigQuery est conçu pour accélérer les tâches d'analyse et aider les professionnels des données tels que les analystes de données, les ingénieurs en données et d'autres professionnels dans leur parcours d'obtention d'insights à partir de données. Vous n'avez pas besoin de connaissances techniques sur des outils spécifiques, mais seulement de savoir lire et écrire du SQL. Le canevas de données BigQuery fonctionne avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.

Le canevas de données BigQuery n'est pas destiné à être utilisé directement par les utilisateurs professionnels.

Les canevas de données BigQuery utilisent Gemini dans BigQuery pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.

Découvrez comment et quand Gemini pour Google Cloud utilise vos données.

Capacités

Le canevas de données BigQuery vous permet d'effectuer les opérations suivantes :

Utiliser des requêtes en langage naturel ou la syntaxe de recherche de mots clés avec les métadonnées Dataplex pour rechercher des éléments tels que des tables, des vues ou des vues matérialisées.
Utiliser le langage naturel pour les requêtes SQL de base. Par exemple :
- Requêtes contenant des clauses FROM, fonctions mathématiques, tableaux et structures.
- Opérations JOIN pour deux tables.
Visualiser les données à l'aide des types de graphiques suivants :
- Graphique à barres
- Carte de densité
- Graphique linéaire
- Graphique à secteurs
- Graphique à nuage de points
Créer des visualisations personnalisées en utilisant le langage naturel pour décrire ce que vous souhaitez.
Automatiser les insights sur les données.

Limites

Les commandes en langage naturel peuvent ne pas fonctionner correctement avec les éléments suivants :
- BigQuery ML
- Apache Spark
- Tables d'objets
- BigLake
- INFORMATION_SCHEMA vues
- JSON
- Champs imbriqués et répétés
- Fonctions et types de données complexes, tels que DATETIME et TIMEZONE
Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.

Bonnes pratiques concernant les requêtes

Avec les bonnes techniques de requêtage, vous pouvez générer des requêtes SQL complexes. Les suggestions suivantes aident le canevas de données BigQuery à affiner vos requêtes en langage naturel pour améliorer la précision de vos requêtes :

Écrivez de manière claire. Énoncez votre demande clairement et évitez d'être vague.
Posez des questions directes. Pour obtenir la réponse la plus précise, posez une question à la fois et rédigez des requêtes concises. Si nécessaire, séparez vos requêtes en différents nœuds dans le canevas de données BigQuery.
Donnez des instructions ciblées et explicites. Mettez en avant les termes clés dans vos requêtes.
Spécifiez l'ordre des opérations. Fournissez des instructions claires et ordonnées. Divisez les tâches en petites étapes ciblées.
Affinez et itérez. Essayez différentes expressions et approches pour voir ce qui donne les meilleurs résultats.

Pour en savoir plus, consultez les bonnes pratiques de requêtage pour le canevas de données BigQuery.

Avant de commencer

Assurez-vous que Gemini dans BigQuery est activé pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur.
Vérifiez que vous disposez des autorisations IAM (Identity and Access Management) nécessaires pour utiliser le canevas de données BigQuery.

Rôles requis

Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Utilisateur BigQuery Studio (roles/bigquery.studioUser)
Utilisateur de Cloud AI Companion (roles/cloudaicompanion.user)

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.

Utiliser le canevas de données BigQuery

Vous pouvez utiliser le canevas de données BigQuery dans la console Google Cloud, une requête ou une table.

Accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, à côté de Requête SQL, cliquez sur Créer, puis sur Tableau de données.
Dans le champ de requête Langage naturel, saisissez une requête en langage naturel.

Par exemple, si vous saisissez Find me tables related to trees, le canevas de données BigQuery renvoie une liste de tables possibles, y compris des ensembles de données publics tels que bigquery-public-data.usfs_fia.plot_tree ou bigquery-public-data.new_york_trees.tree_species.
Sélectionnez une table.

Un nœud de table est ajouté pour la table sélectionnée au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.

Essayer des exemples de workflows

Cette section présente différentes façons d'utiliser le canevas de données BigQuery dans les workflows d'analyse.

Exemple de workflow : Rechercher, interroger et visualiser des données

Dans cet exemple, vous allez utiliser des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données, générer une requête et la modifier. Vous devez ensuite créer un graphique.

Requête 1 : Trouver des données

Dans la console Google Cloud, accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, à côté de Requête SQL, cliquez sur Créer, puis sur Tableau de données.
Dans le champ de requête Langage naturel, saisissez la requête en langage naturel suivante :
```
Chicago taxi trips
```
Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables.
Sélectionnez la table bigquery-public-data.chicago_taxi_trips.taxi_trips, puis cliquez sur Ajouter au canevas.

Un nœud de table est ajouté pour taxi_trips au canevas de données BigQuery. Pour afficher les informations du schéma, les détails de la table ou prévisualiser les données, sélectionnez les différents onglets du nœud de table.

Requête 2 : Générer une requête SQL dans la table sélectionnée

Pour générer une requête SQL pour la table bigquery-public-data.chicago_taxi_trips.taxi_trips, procédez comme suit :

Dans le canevas de données, cliquez sur Requête.

Dans le champ de requête Langage naturel, saisissez les informations suivantes :

Get me the 100 longest trips

Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;

Requête 3 : Modifier la requête

Pour modifier la requête que vous avez générée, vous pouvez modifier manuellement la requête, ou modifier la requête en langage naturel et générer à nouveau la requête. Dans cet exemple, vous utilisez une requête en langage naturel pour modifier la requête afin de ne sélectionner que les trajets pour lesquels le client a payé en espèces.

Dans le champ de requête Langage naturel, saisissez les informations suivantes :

Get me the 100 longest trips where the payment type is cash

Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;

Dans l'exemple précédent, PROJECT_ID correspond à l'ID de votre projet Google Cloud.

Pour afficher les résultats de la requête, cliquez sur Exécuter.

Créer un graphique

Dans le canevas de données, cliquez sur Visualiser.
Cliquez sur Créer un graphique à barres.

Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet. Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation.
Facultatif : Effectuez l'une ou plusieurs des opérations suivantes :
- Pour modifier le graphique, cliquez sur Modifier, puis modifiez le graphique dans le volet Modifier la visualisation.
- Pour partager le canevas de données, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.
- Pour nettoyer le canevas de données, sélectionnez more_vert Autres actions, puis gavel Effacer le canevas. Cette étape permet d'obtenir un canevas vide.

Exemple de workflow : Joindre des tables

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher des données et joindre des tables. Vous allez ensuite exporter une requête sous forme de notebook.

Requête 1 : Trouver des données

Dans le champ de requête Langage naturel, saisissez la requête suivante :
```
Information about trees
```
Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres.
Pour cet exemple, sélectionnez la table bigquery-public-data.new_york_trees.tree_census_1995, puis cliquez sur Ajouter au canevas.

La table s'affiche sur le canevas.

Requête 2 : Joindre les tables sur leur adresse

Sur le canevas de données, cliquez sur Joindre.

Le canevas de données BigQuery suggère des tables à joindre.
Pour ouvrir un nouveau champ de requête Langage naturel, cliquez sur Rechercher des tables.
Dans le champ de requête Langage naturel, saisissez la requête suivante :
```
Information about trees
```
Sélectionnez la table bigquery-public-data.new_york_trees.tree_census_2005, puis cliquez sur Ajouter au canevas.

La table s'affiche sur le canevas.
Sur le canevas de données, cliquez sur Joindre.
Dans la section Sur ce canevas, cochez la case Cellule de table, puis cliquez sur OK.

Dans le champ de requête Langage naturel, saisissez la requête suivante :

Join on address

Le canevas de données BigQuery suggère la requête SQL pour joindre ces deux tables sur leur adresse :

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

Pour exécuter la requête et afficher les résultats, cliquez sur Exécuter.

Exporter la requête sous forme de notebook

Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook.

Dans le canevas de données, cliquez sur Exporter sous forme de notebook.
Dans le volet Enregistrer le notebook, saisissez le nom du notebook et la région dans laquelle vous souhaitez l'enregistrer.
Cliquez sur Enregistrer. Le notebook a bien été créé.
Facultatif : Pour afficher le notebook créé, cliquez sur Ouvrir.

Exemple de workflow : Modifier un graphique à l'aide d'une requête

Dans cet exemple, vous utilisez des requêtes en langage naturel dans le canevas de données BigQuery pour rechercher, interroger et filtrer des données, puis modifier les détails de la visualisation.

Requête 1 : Trouver des données

Pour rechercher des données concernant des noms américains, saisissez la requête suivante :
```
Find data about USA names
```
Le canevas de données BigQuery génère une liste de tables.
Pour cet exemple, sélectionnez la table bigquery-public-data.usa_names.usa_1910_current, puis cliquez sur Ajouter au canevas.

Requête 2 : Interroger les données

Pour interroger les données, cliquez sur Requête dans le canevas de données, puis saisissez la requête suivante :
```
Summarize this data
```
Le canevas de données BigQuery génère une requête semblable à la suivante :
```
SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`
```
Cliquez sur Exécuter. Les résultats de la requête s'affichent.

Requête 3 : Filtrer les données

Dans le canevas de données, cliquez sur Interroger ces résultats.
Pour filtrer les données, saisissez la requête suivante dans le champ de requête SQL :
```
Get me the top 10 most popular names in 1980
```
Le canevas de données BigQuery génère une requête semblable à la suivante :
```
SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;
```
Lorsque vous exécutez la requête, vous obtenez une table contenant les 10 prénoms d'enfants nés en 1980 les plus populaires.

Créer et modifier un graphique

Dans le canevas de données, cliquez sur Visualiser.

Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée.
Pour cet exemple, cliquez sur Créer un graphique à barres.

Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.

Requête 4 : Modifier les détails de la visualisation

Dans le champ de requête Visualisation, saisissez les éléments suivants :
```
Create a bar chart sorted high to low, with a gradient
```
Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :
Facultatif : Pour apporter des modifications supplémentaires, cliquez sur Modifier.

Le volet Modifier la visualisation s'affiche. Vous pouvez modifier des détails tels que le titre du graphique, le nom de l'axe des abscisses et le nom de l'axe des ordonnées. De plus, si vous cliquez sur l'onglet Éditeur JSON, vous pouvez modifier directement le graphique en fonction des valeurs JSON.

Afficher tous les canevas de données

Pour afficher la liste de tous les canevas de données de votre projet, procédez comme suit :

Dans la console Google Cloud, accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet Explorateur, cliquez sur Afficher les actions à côté de Canevas de données, puis effectuez l'une des opérations suivantes :

Pour ouvrir la liste dans l'onglet actuel, cliquez sur Tout afficher.
Pour ouvrir la liste dans un nouvel onglet, cliquez sur Tout afficher dans > Nouvel onglet.
Pour ouvrir la liste dans un onglet divisé, cliquez sur Tout afficher dans > Diviser l'onglet.

Afficher les métadonnées du canevas de données

Pour afficher les métadonnées du canevas de données, procédez comme suit :

Dans la console Google Cloud, accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet Explorateur, développez votre projet et le dossier Canevas de données, puis, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez afficher les métadonnées.
Consultez le volet Résumé pour afficher des informations sur le canevas de données, telles que la région qu'elle utilise et la date de sa dernière modification.

Utiliser les versions du canevas de données

Vous pouvez afficher, comparer et restaurer les versions d'un canevas de données.

Afficher et comparer les versions du canevas de données

Pour afficher différentes versions d'un canevas de données et les comparer à la version actuelle, procédez comme suit :

Dans la console Google Cloud, accédez à la page BigQuery.

Accéder à BigQuery
Dans le volet Explorateur, développez votre projet et le dossier Canevas de données, puis, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez afficher l'activité.
Cliquez sur l'onglet Activité pour afficher la liste des versions du canevas de données par ordre décroissant de date.
Cliquez sur Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la version actuelle du canevas de données.
(Facultatif) Pour comparer les versions de manière intégrée plutôt que dans des volets distincts, cliquez sur Comparer, puis sur Intégré.

Restaurer une version d'un canevas de données

Utilisez l'une des options suivantes pour restaurer une version de canevas de données. La restauration à partir du volet de comparaison vous permet de comparer la version précédente du canevas de données à la version actuelle avant de la restaurer.

Volet Activité

Dans le volet Explorateur, développez votre projet et le dossier Canevas de données, puis, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
Sélectionnez le volet Activité.
Cliquez sur le bouton Afficher les actions en regard de la version du canevas de données que vous souhaitez restaurer, puis cliquez sur Restaurer.
Cliquez sur Confirmer pour confirmer l'action.

Volet Comparaison

Dans le volet Explorateur, développez votre projet et le dossier Canevas de données, puis, si nécessaire, le dossier Canevas de données partagés. Cliquez sur le nom du canevas de données dont vous souhaitez restaurer une version précédente.
Sélectionnez le volet Activité.
Cliquez sur Afficher les actions à côté d'une version de canevas de données, puis sur Comparer. Le volet de comparaison s'ouvre. Il compare la version du canevas de données que vous avez sélectionnée avec la dernière version du canevas de données.
Si vous souhaitez restaurer la version précédente du canevas de données après la comparaison, cliquez sur Restaurer.
Cliquez sur Confirmer pour confirmer l'action.

Tarifs

Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.

Quotas et limites

Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.

Envoyer des commentaires

Vous pouvez nous aider à améliorer les suggestions du canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :

Dans la barre d'outils de la console Google Cloud, cliquez sur Envoyer des commentaires.
Facultatif : Pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires, cliquez sur Copier.
Pour remplir le formulaire et nous faire part de vos commentaires, cliquez sur Formulaire.

Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable et serviceusage.services.list. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.

Pour nous faire directement part de vos commentaires sur cette fonctionnalité, vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com.

Étapes suivantes

Découvrez comment écrire des requêtes avec l'assistance Gemini.
Apprenez à créer des notebooks.