Vous pouvez utiliser Gemini, un outil de collaboration basé sur l'IA dans Google Cloud, pour générer du code SQL et Dataform Core dans les fichiers .sqlx
de Dataform.
Découvrez comment et quand Gemini pour Google Cloud utilise vos données.
Gemini dans Dataform n'accepte que les requêtes en anglais.Ce document est destiné aux analystes de données, aux data scientists et aux développeurs de données qui travaillent avec des workflows dans Dataform. Nous partons du principe que vous connaissez la syntaxe Google SQL et que vous savez comment créer des actions de workflow Dataform.
Avant de commencer
-
In the Google Cloud console, go to the project selector page.
-
Select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
- Activez Gemini dans BigQuery.
Générer une requête
Vous pouvez fournir à Gemini une instruction en langage naturel (ou requête) pour générer une requête SQL ou Dataform Core basée sur les actions de workflow définies dans votre dépôt.
Par exemple, vous pouvez utiliser Gemini pour générer une instruction SQL SELECT
dans un fichier de définition de table .sqlx
.
Pour générer une requête SQL ou Dataform Core :
Dans la console Google Cloud , accédez à la page Dataform.
Sélectionnez ou créez un dépôt, puis sélectionnez ou créez un espace de travail.
Dans le volet Fichiers, sélectionnez ou créez un fichier
.sqlx
.Dans l'onglet "Fichier", cliquez sur pen_spark Gemini.
Dans la boîte de dialogue Gemini, saisissez une requête en langage naturel.
Si vous savez quelle action SQL vous souhaitez utiliser, vous pouvez spécifier son nom en le plaçant entre des accents graves (
`
) dans votre requête.Cliquez sur Générer.
Gemini examine les actions SQL définies dans votre dépôt afin d'identifier celles qui pourraient être pertinentes pour votre requête et suggère une requête.
Facultatif : Pour envoyer des commentaires, cliquez sur thumb_up J'aime la suggestion, thumb_down Je n'aime pas la suggestion ou chat_info Envoyer plus de commentaires.
Pour accepter la suggestion, cliquez sur Insérer.
Conseils pour générer des requêtes
Les conseils suivants peuvent améliorer les suggestions fournies par Gemini dans Dataform :
- Indiquez le nom de l'action SQL entre guillemets inversés (
`
), par exemple`
action_name
`
. - Si les noms des colonnes ou leurs relations sémantiques sont peu clairs ou complexes, vous pouvez fournir du contexte dans la requête pour guider Gemini vers la réponse souhaitée. C'est ce qu'on appelle le prompt engineering. Par exemple, pour encourager une requête générée à référencer un nom de colonne, décrivez ce nom de colonne et sa pertinence par rapport à la réponse que vous souhaitez. Pour encourager une réponse faisant référence à des termes complexes tels que valeur vie ou marge brute, décrivez le concept et sa pertinence par rapport à vos données pour améliorer les résultats de la génération SQL.
Données Gemini et Dataform
Gemini dans Dataform peut accéder aux métadonnées des tables auxquelles vous êtes autorisé à accéder. Il peut s'agir de noms de tables, de noms de colonnes, de types de données et de descriptions de colonnes. Gemini dans Dataform ne peut pas accéder aux données de vos tables, vues ou modèles. Pour mieux comprendre comment Gemini utilise vos données, consultez Utilisation de vos données par Gemini pour Google Cloud .
Étapes suivantes
- Pour en savoir plus sur Gemini pour Google Cloud, consultez la présentation de Gemini pour Google Cloud .
- Pour en savoir plus sur les règles relatives aux données Gemini, consultez Comment Gemini pour Google Cloud utilise vos données.