Créer des workflows
Pour demander de l'aide ou envoyer des commentaires concernant cette fonctionnalité, envoyez un e-mail à l'adresse bigquery-workflows-preview-feedback@google.com.
Ce document explique comment créer des workflows dans BigQuery. Les workflows sont alimentés par Dataform.
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
- Suivez les instructions de la page Activer la gestion des composants de code pour enregistrer, partager et gérer des versions de composants de code tels que les workflows.
- Si c'est la première fois que vous créez un composant de code, définissez la région par défaut pour le stockage des composants de code. Vous ne pouvez pas modifier la région d'un composant de code après sa création.
Rôles requis
Pour obtenir les autorisations nécessaires pour créer des workflows, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
-
Pour créer des workflows :
Créateur de code (
roles/dataform.codeCreator
) -
Pour modifier et exécuter des workflows :
Éditeur Dataform (
roles/dataform.editor
)
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur IAM pour Dataform, consultez la section Contrôle des accès avec IAM.
Créer un workflow
Pour créer un workflow, procédez comme suit :
Accédez à la page BigQuery.
Dans la barre d'onglets du volet de l'éditeur, cliquez sur la flèche de menu déroulant
à côté du signe +, puis sur Workflow.Facultatif : Pour renommer le workflow, cliquez sur son nom, puis saisissez un nouveau nom.
Cliquez sur Commencer, puis accédez à l'onglet Paramètres.
Dans le champ Compte de service, sélectionnez un compte de service Dataform.
Dans la section Emplacement, sélectionnez une région de traitement pour le workflow.
- Pour sélectionner une région spécifique, sélectionnez Région, puis sélectionnez une région dans le menu déroulant Région.
- Pour sélectionner un emplacement multirégional, sélectionnez Multirégional, puis sélectionnez un emplacement multirégional dans le menu déroulant Multirégional.
La région de traitement du workflow n'a pas besoin de correspondre à votre région de stockage par défaut pour les composants de code.
Si vous prévoyez d'ajouter un notebook à votre workflow, procédez comme suit :
Dans le champ Bucket Cloud Storage, cliquez sur Parcourir, puis sélectionnez ou créez un bucket Cloud Storage pour stocker la sortie des notebooks dans votre workflow.
Suivez la procédure décrite à la section Ajouter un compte principal à une stratégie au niveau du bucket pour ajouter votre compte de service Dataform personnalisé en tant que compte principal au bucket Cloud Storage que vous prévoyez d'utiliser pour stocker le résultat des exécutions de workflow programmées, et attribuer le rôle Administrateur de l'espace de stockage (
roles/storage.admin
) à ce compte principal.Le compte de service Dataform personnalisé sélectionné doit disposer du rôle IAM "Administrateur de stockage" sur le bucket sélectionné.
Ajouter une tâche de workflow
Pour ajouter une tâche à un workflow, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorateur, développez votre projet et le dossier Workflows, puis sélectionnez un workflow.
Pour ajouter une requête SQL ou un notebook, procédez comme suit :
Requête SQL
Cliquez sur Ajouter une tâche, puis sélectionnez Requête.
Facultatif : Dans le volet Détails de la tâche de requête, dans le menu déroulant Exécuter après, sélectionnez une tâche qui précèdera votre requête.
Votre requête dépendra de la tâche qui la précède.
Pour créer la requête, cliquez sur Créer une requête.
Dans la nouvelle requête, ajoutez la syntaxe de la requête, puis cliquez sur Enregistrer la requête.
Facultatif : Pour renommer la requête, cliquez sur son nom et saisissez un nouveau nom.
Notebook
Cliquez sur Ajouter une tâche, puis sélectionnez Notebook.
Facultatif : Dans le volet Détails de la tâche de notebook, dans le menu déroulant Exécuter après, sélectionnez une tâche qui précèdera votre notebook.
Votre notebook dépendra de la tâche qui le précède.
Pour créer le notebook, cliquez sur Créer un notebook.
Dans le nouveau notebook, ajoutez-y du contenu, puis cliquez sur Enregistrer.
Facultatif : Pour renommer le notebook, cliquez sur son nom et saisissez un nouveau nom.
Modifier une tâche de workflow
Pour modifier une tâche de workflow, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorateur, développez votre projet et le dossier Workflows, puis sélectionnez un workflow.
Cliquez sur la tâche sélectionnée.
Pour modifier la tâche précédente, dans le menu déroulant Exécuter après, sélectionnez une tâche qui précèdera votre notebook.
Pour modifier le contenu de la tâche sélectionnée, cliquez sur Modifier.
Dans le nouvel onglet qui s'ouvre, modifiez le contenu de la tâche, puis enregistrez les modifications apportées à la tâche.
Supprimer une tâche de workflow
Pour supprimer une tâche d'un workflow, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorateur, développez votre projet et le dossier Workflows, puis sélectionnez un workflow.
Cliquez sur la tâche sélectionnée.
Dans le volet Détails de la tâche, cliquez sur l'icône SupprimerSupprimer.
Exécuter un workflow
Pour exécuter manuellement la version actuelle d'un workflow, procédez comme suit :
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le volet Explorateur, développez votre projet et le dossier Workflows, puis sélectionnez un workflow.
Cliquez sur Exécuter.
Facultatif : Pour inspecter l'exécution, affichez les exécutions manuelles précédentes.
Étape suivante
- Apprenez-en plus sur les workflows dans BigQuery.
- Découvrez comment gérer les workflows.