Planifier des exécutions en production
Ce guide de démarrage rapide vous explique comment planifier des exécutions en production dans Dataform:
- Créez un dépôt Dataform.
- Accordez à Dataform l'accès à BigQuery.
Créez une configuration de version pour configurer l'environnement de production.
Créez une configuration de version
production
à la fréquence de création des résultats de compilationproduction
.-
Créez une configuration de workflow
production
, sélectionnez la configuration de versionproduction
et définissez un calendrier d'exécution des résultats de la compilationproduction
.
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Rôles requis
Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous attribuer les rôles IAM suivants:
-
Administrateur Dataform (
roles/dataform.admin
) sur les dépôts -
Éditeur Dataform (
roles/dataform.editor
) sur les espaces de travail et les appels de workflow
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Créer un dépôt Dataform
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
Créer un dépôt.Sur la page Créer un dépôt, procédez comme suit:
Dans le champ ID du dépôt, saisissez
quickstart-production
.Dans la liste Région, sélectionnez
europe-west4
.Cliquez sur Créer.
Cliquez sur OK.
Accorder à Dataform l'accès à BigQuery
Pour exécuter des workflows dans BigQuery, le compte de service Dataform doit disposer des rôles requis suivants:
- Éditeur de données BigQuery pour les projets pour lesquels Dataform a besoin d'un accès en lecture et en écriture. Ils incluent généralement le projet hébergeant votre dépôt Dataform.
- Lecteur de données BigQuery pour les projets pour lesquels Dataform a besoin d'un accès en lecture seule.
- Utilisateur de tâche BigQuery sur le projet hébergeant votre dépôt Dataform
Pour attribuer ces rôles, procédez comme suit:
Dans la console Google Cloud, accédez à la page IAM.
Cliquez sur Ajouter.
Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service Dataform.
Dans la liste déroulante Sélectionnez un rôle, sélectionnez le rôle Utilisateur de job BigQuery.
Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Éditeur de données BigQuery.
Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Lecteur de données BigQuery.
Cliquez sur Enregistrer.
Créer une configuration de version
Pour créer les résultats de la compilation de production du dépôt quickstart-production
, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations de version, puis sur Configuration de la nouvelle version.
Dans le volet Créer une configuration de version, configurez les paramètres suivants:
Dans le champ ID de version, saisissez
production
.Dans le champ Git commitish, conservez la valeur par défaut
main
.Dans la liste déroulante Fréquence, sélectionnez Personnalisée.
Dans le champ Planification personnalisée, saisissez
0 16 * * *
.Dans la liste déroulante Fuseau horaire, sélectionnez un fuseau horaire UTC+1, par exemple Heure moyenne de Greenwich (GMT).
Chaque jour à 16h UTC+1, Dataform compile le dépôt
quickstart-production
et applique les paramètres de compilation configurés dans cette configuration de version pour créer des résultats de compilationproduction
.Cliquez sur Créer.
La configuration de version production
crée un résultat de compilation de l'ensemble du dépôt quickstart-production
tous les jours à 16h UTC+1.
Créer une configuration de workflow
Pour planifier l'exécution de tables production
, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations de workflow, puis sur Nouvelle configuration de workflow.
Dans le volet Créer une configuration de workflow, saisissez
production
dans le champ ID de configuration.Dans la liste déroulante Configuration de la version, sélectionnez
production
.Dans le champ Fréquence, saisissez
0 17 * * *
.Dans la liste déroulante Fuseau horaire, sélectionnez un fuseau horaire UTC+1, par exemple Heure moyenne de Greenwich (GMT).
Chaque jour, à 17h UTC+1, Dataform exécute le dernier résultat de compilation
production
du dépôtquickstart-production
.Pour vous assurer que Dataform exécute le dernier résultat de compilation dans la configuration de version correspondante, conservez une pause d'au moins une heure entre le moment de la création du résultat de la compilation et celui de l'exécution planifiée.
Cliquez sur Toutes les actions.
Dataform exécutera toutes les actions du workflow SQL dans le résultat de la compilation
production
.Cliquez sur Créer.
La configuration du workflow production
exécute l'intégralité du dernier résultat de compilation créé par la configuration de version production
tous les jours à 16h UTC+1.
Afficher les résultats de compilation production
précédents
Pour afficher les résultats de la compilation production
programmée précédemment, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations des versions.
Cliquez sur
production
.
Afficher les production
exécutions précédentes du workflow
Pour afficher les exécutions précédentes du workflow production
, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations de workflow.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :
Supprimer l'ensemble de données créé dans BigQuery
Afin d'éviter que des frais ne vous soient facturés pour les éléments BigQuery, procédez comme suit pour supprimer l'ensemble de données nommé dataform_production
:
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le panneau Explorateur, développez votre projet et sélectionnez
dataform_production
.Cliquez sur le menu Actions
, puis sélectionnez Supprimer.Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez delete, puis cliquez sur Supprimer.
Supprimer la configuration de version Dataform
Aucun coût n'est associé à la création de configurations de version Dataform. Toutefois, si vous souhaitez supprimer la configuration de version production
, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations des versions.
À côté de la configuration de version
production
, cliquez sur le menu Plus, puis sur Supprimer.Dans la boîte de dialogue Delete release configuration (Supprimer la configuration de version), cliquez sur Delete (Supprimer).
Supprimer la configuration de workflow Dataform
Pour éviter que des frais liés aux éléments BigQuery ne vous soient facturés, procédez comme suit afin de supprimer la configuration de workflow Dataform production
:
Dans la console Google Cloud, accédez à la page Dataform.
Cliquez sur
quickstart-production
.Cliquez sur Configurations de workflow.
Dans la configuration du workflow
production
, cliquez sur le menu Plus, puis sur Supprimer.Dans la boîte de dialogue Delete release configuration (Supprimer la configuration de version), cliquez sur Delete (Supprimer).
Supprimer le dépôt Dataform
La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform.
Dans
quickstart-production
, cliquez sur le menu Plus, puis sélectionnez Supprimer.Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.
Pour confirmer l'opération, cliquez sur Supprimer.
Étapes suivantes
Pour en savoir plus sur le cycle de vie du code dans Dataform, consultez la page Présentation du cycle de vie du code dans Dataform.
Pour en savoir plus sur les bonnes pratiques concernant le cycle de vie du code dans Dataform, consultez Gérer le cycle de vie du code.
Pour en savoir plus sur les configurations de version dans Dataform, consultez la page Créer une configuration de version.
Pour en savoir plus sur les configurations de workflow dans Dataform, consultez la page Planifier des exécutions avec des configurations de workflow.