Analyser avec les canevas de données

Pour envoyer des commentaires ou demander de l'aide concernant les canevas de données BigQuery, envoyez un e-mail à l'adresse datacanvas-feedback@google.com.

Les canevas de données BigQuery vous permettent de découvrir, de transformer, d'interroger et de visualiser des données en langage naturel. Les canevas de données BigQuery fournissent une interface graphique pour l'analyse qui vous permet d'utiliser des sources de données, des requêtes et des visualisations dans un graphe orienté acyclique (DAG). Vous bénéficiez ainsi d'un vue graphique de votre workflow d'analyse correspondant à votre modèle mental. Dans les canevas de données BigQuery, vous pouvez effectuer une itération sur les résultats de requête et travailler avec plusieurs branches d'interrogation au même endroit.

Les canevas de données BigQuery sont conçus pour vous aider dans votre parcours d'obtention d'insights à partir de données. Vous pouvez travailler avec des données sans avoir besoin de connaissances techniques sur des outils ou produits spécifiques. Les canevas de données BigQuery fonctionnent avec les métadonnées Dataplex pour identifier les tables appropriées en fonction du langage naturel.

Les canevas de données BigQuery utilisent Gemini pour rechercher vos données, créer du code SQL, générer des graphiques et créer des résumés de données.

Capacités

Le canevas de données BigQuery est compatible avec les fonctionnalités suivantes :

  • Recherchez des éléments de table à l'aide de la syntaxe de recherche de mots clés avec des métadonnées Dataplex, telles que des tables, des vues ou des vues matérialisées.

  • Utilisez le langage naturel pour les requêtes SQL simples, telles que :

    • Des requêtes avec SELECT FROM, des fonctions mathématiques, des tableaux et des structures
    • Des instructions JOIN entre deux tables
  • Des visualisations courantes, y compris les types de graphiques suivants :

    • Graphique à barres
    • Carte thermique
    • Graphique linéaire
    • Graphique à secteurs
    • Graphique à nuages de points
  • Des visualisations personnalisées, dans lesquelles vous pouvez utiliser le langage naturel pour décrire ce que vous souhaitez

  • Des insights automatiques sur les données

Le canevas de données BigQuery présente les limites suivantes :

  • Les commandes en langage naturel peuvent présenter des difficultés lorsque vous travaillez avec les éléments suivants :

    • BigQuery ML
    • Apache Spark
    • Tables d'objets
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • Champs imbriqués et répétés
    • Fonctions et types de données complexes, tels que DATETIME et TIMEZONE
  • Les visualisations de données ne fonctionnent pas avec les graphiques de cartes géographiques.

Avant de commencer

Pour accéder à Gemini dans les fonctionnalités BigQuery, un administrateur doit activer Gemini dans BigQuery. Pour en savoir plus, consultez la page Configurer Gemini dans BigQuery.

Pour obtenir les autorisations nécessaires pour utiliser le canevas de données BigQuery, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Utiliser les canevas de données BigQuery

Les canevas de données BigQuery vous permettent de découvrir, de transformer, d'interroger et de visualiser des données à l'aide d'une approche directe basée sur le langage naturel. Les exemples suivants illustrent certaines des manières d'interagir avec les canevas de données BigQuery, y compris un exemple de workflow allant de la découverte des données à la visualisation.

Pour commencer à utiliser les canevas de données BigQuery :

  1. Accédez à Google Cloud Console.

    Accéder à BigQuery

  2. Dans le menu de navigation, cliquez sur BigQuery.

  3. Cliquez sur Créer un canevas de données. Vous pouvez également démarrer un canevas de données BigQuery directement à partir d'une table ou d'une requête.

  4. Saisissez votre première requête en langage naturel dans le champ de texte.

Examples

Les exemples suivants illustrent un workflow de canevas de données BigQuery classique.

Exemple 1 : Travailler avec une seule table

Requête 1 : Trouver des données

Chicago taxi trips

Résultat potentiel :

Le canevas de données BigQuery génère une liste de tables potentielles basées sur les métadonnées Dataplex. Vous pouvez sélectionner plusieurs tables. Chaque table possède les options suivantes : Ajouter au canevas, Requête et Détails. Pour cet exemple, nous allons sélectionner la table bigquery-public-data.chicago_taxi_trips.taxi_trips, puis cliquer sur Ajouter au canevas.

Une cellule de table est ajoutée pour taxi_trips au canevas de données BigQuery. Vous pouvez parcourir les onglets de la cellule de table pour afficher les informations de schéma, les détails de la table et un aperçu des données.

Cliquez sur Requête pour interroger cette table en langage naturel.

Requête 2 : Créer une requête SQL avec la table choisie

Get me the 100 longest trips

Résultat potentiel :

Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Vous pouvez également modifier la requête, soit en modifiant manuellement la requête SQL, soit en modifiant la requête en langage naturel et en générant à nouveau la requête. Pour cet exemple, nous allons modifier notre requête en langage naturel pour ne sélectionner que les trajets pour lesquels le client a payé en espèces.

Requête 3 : Modifiez la requête

Get me the 100 longest trips where the payment type is cash

Résultat potentiel

Le canevas de données BigQuery génère une requête SQL semblable à la suivante :

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

Cliquez sur Exécuter pour afficher les résultats de la requête.

Requête 4 : Créer un graphique

  1. Cliquez sur Visualiser.
  2. Cliquez sur Créer un graphique à barres.

Résultat potentiel

Le canevas de données BigQuery crée un graphique à barres affichant le nombre maximal de kilomètres par ID de trajet.

Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.

Si vous souhaitez partager le canevas de données BigQuery, cliquez sur Partager, puis sur Partager le lien pour copier le lien du canevas de données BigQuery.

Pour nettoyer le canevas de données BigQuery, cliquez sur Effacer le canevas. Cela vous laisse un canevas vide.

Exemple 2 : Travailler avec plusieurs tables

Requête 1 :

Information about trees

Résultat potentiel :

Le canevas de données BigQuery suggère plusieurs tables contenant des informations sur les arbres. Pour cet exemple, nous allons travailler avec deux tables : bigquery-public-data.new_york_trees.tree_census_1995 et bigquery-public-data.new_york_trees.tree_census_2015.

Une fois ces deux tables sélectionnées, elles s'affichent sur le canevas.

Pour cet exemple, cliquez sur Joindre dans la table bigquery-public-data.new_york_trees.tree_census_1995 pour joindre les deux tables. Le canevas de données BigQuery suggère des tables à joindre. Cochez bigquery-public-data.new_york_trees.tree_census_2015. Un nouveau volet s'affiche, avec des connexions à chacune des tables.

Requête n°2 :

Join these tables on their address

Résultat potentiel

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

Le canevas de données BigQuery propose la requête SQL pour joindre ces deux tables sur leur adresse. Cliquez sur Exécuter pour exécuter la requête et afficher les résultats.

Le canevas de données BigQuery vous permet d'exporter vos requêtes sous forme de notebook. Pour exporter vers un notebook :

  1. Cliquez sur l'onglet Exporter en tant que notebook.
  2. Dans le volet "Enregistrer le notebook", saisissez le nom et la région sous lesquels vous souhaitez enregistrer le notebook.
  3. Cliquez sur Enregistrer. Le notebook a bien été créé.
  4. Cliquez sur Ouvrir dans BQ Studio pour afficher le notebook créé.

Exemple 3

Requête 1

Find data about USA names

Résultat potentiel

Le canevas de données BigQuery génère une liste de tables. Pour cet exemple, nous allons sélectionner la table bigquery-public-data.usa_names.usa_1910_current.

Cliquez sur Requête pour interroger les données. Saisissez une requête pour interroger les données.

Résultat potentiel

Le canevas de données BigQuery génère la requête suivante :

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

Le canevas de données BigQuery génère les résultats de la requête. Nous allons demander une requête supplémentaire pour filtrer ces données. Cliquez sur Interroger ces résultats.

Requête 2

Get me the top 10 most popular names in 1980

Résultat potentiel

Le canevas de données BigQuery génère la requête suivante :

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

Après avoir exécuté la requête, nous obtenons une table contenant les 10 prénoms d'enfants les plus populaires pour les enfants nés en 1980.

Pour cet exemple, nous allons visualiser ces résultats. Cliquez sur Visualiser. Le canevas de données BigQuery suggère plusieurs options de visualisation, comme un graphique à barres, un graphique à secteurs, un graphique en courbes et une visualisation personnalisée. Cliquez sur Créer un graphique à barres.

Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

Graphique à barres des 10 noms les plus utilisés.

Outre la fourniture d'un graphique, le canevas de données BigQuery résume certains des détails clés des données à la base de la visualisation. Vous pouvez modifier le graphique en cliquant sur Détails de la visualisation et en modifiant votre graphique dans le panneau latéral.

Requête 3

Create a bar chart sorted high to low, with a gradient

Résultat potentiel

Le canevas de données BigQuery crée un graphique à barres semblable à celui-ci :

Graphique à barres trié des 10 noms les plus utilisés

Pour apporter des modifications supplémentaires, cliquez sur Détails de visualisation. La barre latérale des détails Vis s'affiche. Vous pouvez modifier le titre du graphique, le nom de l'axe des abscisses, le nom de l'axe des ordonnées, etc. De plus, si vous cliquez sur l'onglet JSON, vous pouvez apporter des modifications directes au graphique en fonction des valeurs JSON.

Tarification

Vous êtes facturé en fonction du modèle de tarification basé sur le calcul ou le stockage lorsque vous utilisez le canevas de données BigQuery. L'utilisation de Gemini avec le canevas de données BigQuery pendant la version bêta n'entraîne aucuns frais supplémentaires.

Fournir des commentaires

Vous pouvez nous aider à améliorer les suggestions de canevas de données BigQuery en envoyant vos commentaires à Google. Pour envoyer des commentaires, procédez comme suit :

  1. Dans la console Google Cloud, dans la barre d'outils, cliquez sur Envoyer des commentaires.

  2. Facultatif : cliquez sur Copier pour copier les informations JSON du DAG afin de fournir davantage de contexte à vos commentaires.

  3. Cliquez sur Formulaire et remplissez le formulaire pour nous faire part de vos commentaires.

Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable et serviceusage.services.list. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.

Vous pouvez également nous contacter à l'adresse datacanvas-feedback@google.com pour nous faire directement part de vos commentaires sur cette fonctionnalité.

Étapes suivantes