Rédiger des requêtes avec l'aide de Gemini
Ce document explique comment utiliser l'assistance basée sur l'IA dans Gemini dans BigQuery pour vous aider à interroger vos données à l'aide de requêtes SQL et de code Python. Gemini dans BigQuery peut générer des requêtes et du code, exécuter des requêtes et du code à mesure que vous tapez du texte et expliquer les requêtes.
Pour obtenir des instructions détaillées sur cette tâche directement dans la console Google Cloud, cliquez sur Visite guidée :
Sans votre autorisation expresse, Gemini pour Google Cloud n'utilise pas vos requêtes ni ses réponses comme des données destinées à l'entraînement de ses modèles. Pour en savoir plus sur la manière dont Google utilise vos données, consultez la section Utilisation de vos données par Gemini pour Google Cloud.
Gemini dans BigQuery n'accepte que des requêtes en anglais.
Ce document est destiné aux analystes de données, aux data scientists et aux développeurs de données qui travaillent avec des requêtes SQL et des notebooks Colab Enterprise dans BigQuery. Nous partons du principe que vous savez interroger des données dans l'environnement BigQuery Studio ou utiliser des notebooks Python pour analyser des données BigQuery.
Avant de commencer
- Assurez-vous que Gemini dans BigQuery est configuré pour votre projet Google Cloud. Cette étape est généralement effectuée par un administrateur. Les fonctionnalités Gemini dans BigQuery peuvent être désactivées ou indisponibles jusqu'à ce que vous ayez terminé les étapes restantes de cette section.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans la barre d'outils BigQuery, cliquez sur pen_spark Gemini.
Dans la liste des fonctionnalités, assurez-vous que les fonctionnalités suivantes sont sélectionnées:
Liste Gemini dans une requête SQL:
- Saisie semi-automatique (bêta) Au fur et à mesure que vous tapez du texte dans l'éditeur de requête, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle, ou vous aider à effectuer une itération sur une requête.
- Génération automatique Vous pouvez demander à Gemini dans BigQuery de générer une requête SQL à l'aide d'un commentaire en langage naturel, tapé dans l'éditeur de requête BigQuery.
- Outil de génération SQL Vous pouvez saisir du texte en langage naturel dans un outil pour générer une requête SQL, avec des options permettant d'affiner les résultats de la requête, de choisir les sources de tables et de comparer les résultats.
- Explication Vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel.
Liste Gemini dans un notebook Python:
- Complétion de code (preview) Gemini fournit des recommandations contextuelles appropriées basées sur le contenu du notebook.
- Génération de code Vous pouvez interroger Gemini à l'aide d'une instruction ou d'une question en langage naturel, afin de générer du code Python.
Pour effectuer les tâches décrites dans ce document, assurez-vous de disposer des autorisations Identity and Access Management (IAM) requises.
Rôles requis
Pour obtenir les autorisations nécessaires pour écrire des requêtes avec l'assistance Gemini, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur de Gemini pour Google Cloud (roles/cloudaicompanion.user
) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour écrire des requêtes avec l'assistance Gemini. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour écrire des requêtes avec l'assistance Gemini :
-
cloudaicompanion.entitlements.get
-
cloudaicompanion.instances.completeTask
-
Expliquer les requêtes SQL :
cloudaicompanion.companions.generateChat
-
Code SQL ou Python complet :
cloudaicompanion.instances.completeCode
-
Générez du code SQL ou Python :
cloudaicompanion.instances.generateCode
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.
Générer une requête SQL
Pour générer une requête SQL basée sur le schéma de vos données, vous pouvez fournir à Gemini dans BigQuery une instruction ou une question en langage naturel, également appelée requête. Même si vous débutez sans la moindre portion de code, que vous n'avez que des connaissances limitées sur le schéma de données ou bien seulement des connaissances de base sur la syntaxe GoogleSQL, Gemini dans BigQuery peut générer du code SQL qui peut vous aider à explorer vos données.
Utiliser l'outil de génération SQL
L'outil de génération de SQL vous permet d'utiliser le langage naturel pour générer une requête SQL sur les tables que vous avez consultées ou interrogées récemment. Vous pouvez également utiliser l'outil pour modifier une requête existante et spécifier manuellement les tables pour lesquelles vous souhaitez générer du code SQL.
Procédez comme suit pour utiliser l'outil de génération SQL :
Dans la console Google Cloud, accédez à la page BigQuery Studio.
À côté de l'éditeur de requête, cliquez sur pen_spark Outil de génération SQL.
Dans la boîte de dialogue Générer du code SQL avec Gemini, saisissez une requête en langage naturel concernant une table que vous avez récemment consultée ou interrogée. Par exemple, si vous avez récemment consulté la table
bigquery-public-data.austin_bikeshare.bikeshare_trips
, vous pouvez saisir ce qui suit:Show me the duration and subscriber type for the ten longest trips.
Cliquez sur Générer.
La requête SQL générée est semblable à celle-ci:
SELECT subscriber_type, duration_sec FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` ORDER BY duration_sec DESC LIMIT 10;
Examinez la requête SQL générée et effectuez l'une des actions suivantes:
- Pour accepter la requête SQL générée, cliquez sur Insérer pour insérer l'instruction dans l'éditeur de requête. Vous pouvez ensuite cliquer sur Exécuter pour exécuter la requête SQL suggérée.
- Pour modifier votre requête, cliquez sur Modifier, puis modifiez ou remplacez votre requête initiale. Une fois que vous avez modifié votre requête, cliquez sur Mettre à jour pour générer une nouvelle requête.
- Pour mettre à jour les sources de tables utilisées comme contexte pour générer la requête SQL suggérée, cliquez sur Modifier les sources des tables, sélectionnez les cases à cocher appropriées, puis cliquez sur Appliquer.
- Pour afficher un résumé en langage naturel de la requête générée, cliquez sur Récapitulatif de la requête.
- Pour affiner la requête SQL suggérée, saisissez des ajustements dans le champ Affiner, puis cliquez sur
limit to 1000
pour limiter le nombre de résultats de la requête. Pour comparer les modifications apportées à votre requête, cochez la case Afficher le différentiel.
Affiner. Par exemple, saisissez - Pour ignorer une requête suggérée, fermez l'outil de génération SQL.
Désactiver l'outil de génération SQL
Pour savoir comment désactiver l'outil de génération SQL, consultez la section Désactiver les fonctionnalités de l'assistant de requête Gemini.
Générer du code SQL à partir d'un commentaire
Vous pouvez générer du code SQL dans l'éditeur de requête en décrivant la requête souhaitée dans un commentaire.
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans l'éditeur de requête, cliquez sur
. Requête SQL Dans l'éditeur de requêtes, écrivez un commentaire SQL sur une table que vous avez récemment consultée ou interrogée. Par exemple, si vous avez récemment consulté la table
bigquery-public-data.austin_bikeshare.bikeshare_trips
, vous pouvez écrire le commentaire suivant:# Show me the duration and subscriber type for the ten longest trips.
Appuyez sur Entrée (Retour sous macOS).
La requête SQL suggérée est semblable à celle-ci:
# Show me the duration and subscriber type for the ten longest trips SELECT duration_sec, subscriber_type AVG(duration_minutes) AS average_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips` ORDER BY duration_sec LIMIT 10;
Pour accepter la suggestion, appuyez sur la touche Tabulation.
Conseils pour la génération SQL
Les conseils suivants peuvent améliorer les suggestions fournies par Gemini dans BigQuery :
- Pour spécifier manuellement les tables à utiliser, vous pouvez inclure le nom complet de la table entre des accents graves (
`
), par exemple`PROJECT.DATASET.TABLE`
. - Si les noms des colonnes ou leurs relations sémantiques sont peu clairs ou complexes, vous pouvez fournir du contexte dans la requête pour guider Gemini vers la réponse souhaitée. Par exemple, pour encourager une requête générée à référencer un nom de colonne, décrivez ce nom de colonne et sa pertinence par rapport à la réponse que vous souhaitez. Pour encourager une réponse faisant référence à des termes complexes tels que valeur vie ou marge brute, décrivez le concept et sa pertinence par rapport à vos données pour améliorer les résultats de la génération SQL.
- Lorsque vous générez du code SQL à partir d'un commentaire, vous pouvez mettre en forme votre requête sur plusieurs lignes en ajoutant le caractère
#
en préfixe de chaque ligne. - Les descriptions de colonne sont prises en compte lorsque vous générez des requêtes SQL. Pour améliorer la précision, ajoutez des descriptions de colonnes à votre schéma. Pour en savoir plus sur les descriptions de colonnes, consultez Descriptions de colonnes dans "Spécifier un schéma".
Données Gemini et BigQuery
Gemini dans BigQuery peut accéder aux métadonnées des tables auxquelles vous êtes autorisé à accéder. Ces métadonnées peuvent inclure des noms de tables, de colonnes, de types de données et de descriptions de colonnes. Gemini dans BigQuery ne peut pas accéder aux données de vos tables, vues ou modèles. Pour en savoir plus sur la manière dont Gemini utilise vos données, consultez la page Comment Gemini pour Google Cloud utilise vos données.
Exécuter une requête SQL
La complétion SQL tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini peut vous suggérer des étapes logiques pertinentes pour le contexte de votre requête actuelle ou vous aider à effectuer une itération sur une requête.
Pour essayer la complétion SQL avec Gemini dans BigQuery, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans l'éditeur de requête, copiez ce qui suit :
SELECT subscriber_type , EXTRACT(HOUR FROM start_time) AS hour_of_day , AVG(duration_minutes) AS avg_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips`
Un message d'erreur indique que
subscriber_type
n'est ni regroupé, ni agrégé. Il n'est pas rare que vous ayez besoin d'aide pour obtenir une requête correcte.À la fin de la ligne de
subscriber_type
, appuyez sur Espace.Les suggestions de filtres pour la requête peuvent se terminer par un texte semblable à celui-ci:
GROUP BY subscriber_type, hour_of_day;
Vous pouvez également appuyer sur Entrée (Retour sous macOS) pour générer des suggestions.
Pour accepter la suggestion, appuyez sur la touche Tabulation ou maintenez le pointeur sur le texte suggéré et cliquez sur les autres suggestions. Pour ignorer une suggestion, appuyez sur Échap ou poursuivez votre saisie.
Expliquer une requête SQL
Vous pouvez demander à Gemini dans BigQuery d'expliquer une requête SQL en langage naturel. Cette explication peut vous aider à comprendre une requête dont la syntaxe, le schéma sous-jacent et le contexte commercial peuvent être difficiles à évaluer en raison de sa longueur ou de sa complexité.
Pour obtenir une explication d'une requête SQL, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans l'éditeur de requête, ouvrez ou collez la requête pour laquelle vous souhaitez obtenir des explications.
Mettez en surbrillance la requête que vous souhaitez voir expliquée par Gemini dans BigQuery.
Cliquez sur astrophotography_mode Gemini, puis sur Expliquer cette requête.
L'explication de la requête SQL apparaît dans le volet Gemini.
Générer du code Python
Vous pouvez demander à Gemini dans BigQuery de générer du code Python à l'aide d'une invite (une instruction ou une question en langage naturel). Gemini dans BigQuery répond avec une ou plusieurs suggestions de code Python.
Dans l'exemple suivant, vous générez du code pour l'ensemble de données public BigQuery bigquery-public-data.ml_datasets.penguins
.
Accédez à la page BigQuery Studio.
Dans la barre d'onglets de l'éditeur de requêtes, cliquez sur la flèche du menu déroulant
à côté de Requête SQL, puis sur Notebook Python.Le nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données public
bigquery-public-data.ml_datasets.penguins
.Pour insérer une nouvelle cellule de code, dans la barre d'outils, cliquez sur
Code. La nouvelle cellule de code contient le message Start coding or generate with AI (Commencer à coder ou générer avec l'IA).Dans la nouvelle cellule de code, cliquez sur Générer.
Dans l'éditeur Generate (Générer), saisissez la requête en langage naturel suivante:
Using bigquery magics, query the `bigquery-public-data.ml_datasets.penguins` table
Appuyez sur Entrée (Retour sous macOS).
Le code Python suggéré ressemble à celui-ci:
%%bigquery SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 10
Pour exécuter le code, appuyez sur
Run cell (Exécuter la cellule).
Finaliser le code Python
La complétion de code Python tente de fournir des recommandations contextuelles appropriées basées sur le contenu de l'éditeur de requête. Au fur et à mesure que vous tapez, Gemini dans BigQuery peut vous suggérer des étapes logiques pertinentes pour le contexte de votre code actuel ou vous aider à effectuer une itération sur votre code.
Pour essayer la complétion de code Python avec Gemini dans BigQuery, procédez comme suit:
Accédez à la page BigQuery Studio.
Dans la barre d'onglets de l'éditeur de requêtes, cliquez sur la flèche du menu déroulant
à côté de Requête SQL, puis sur Notebook Python.Un nouveau notebook s'ouvre. Il contient des cellules dans lesquelles figurent des exemples de requêtes sur l'ensemble de données public
bigquery-public-data.ml_datasets.penguins
.Dans l'éditeur, commencez à saisir du code Python. Par exemple,
%%bigquery
. Gemini dans BigQuery suggère du code intégré pendant que vous tapez du texte.Pour accepter la suggestion, appuyez sur la touche Tabulation.
Désactiver les fonctionnalités de l'assistant de requête Gemini
Pour désactiver des fonctionnalités spécifiques dans Gemini dans BigQuery, procédez comme suit:
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans la barre d'outils BigQuery, cliquez sur
pen_spark Gemini .Dans la liste, désélectionnez les fonctionnalités de l'assistant de requête que vous souhaitez désactiver.
Pour savoir comment désactiver Gemini dans BigQuery, consultez Désactiver Gemini dans BigQuery.
Fournir des commentaires
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans la barre d'outils BigQuery, cliquez sur
pen_spark Gemini .Cliquez sur Envoyer des commentaires.
Contribuer à améliorer les suggestions
Vous pouvez contribuer à améliorer les suggestions de Gemini en partageant avec Google les données de requête que vous envoyez aux fonctionnalités en mode Preview.
Pour partager vos données de requête, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery Studio.
Dans la barre d'outils BigQuery, cliquez sur
pen_spark Gemini .Sélectionnez Partager des données pour améliorer Gemini dans BigQuery.
Dans la boîte de dialogue Paramètres d'utilisation des données, mettez à jour vos paramètres d'utilisation des données.
Les paramètres de partage des données s'appliquent à l'ensemble du projet et ne peuvent être définis que par un administrateur du projet disposant des autorisations IAM serviceusage.services.enable
et serviceusage.services.list
. Pour en savoir plus sur l'utilisation des données dans le programme Testeur de confiance, consultez la page Gemini dans le programme Testeur de confiance de Google Cloud.
Tarifs
Pour en savoir plus sur les tarifs de cette fonctionnalité, consultez la section Présentation des tarifs de Gemini dans BigQuery.
Quotas et limites
Pour en savoir plus sur les quotas et les limites de cette fonctionnalité, consultez la page Quotas pour Gemini dans BigQuery.
Étape suivante
- Consultez la Présentation de Gemini pour Google Cloud.
- Découvrez comment Gemini pour Google Cloud utilise vos données.