Planifier des exécutions en production

Ce guide de démarrage rapide vous explique comment planifier des exécutions en production dans Dataform:

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Enable the APIs

Rôles requis

Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous accorder les rôles IAM suivants:

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Créer un dépôt Dataform

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur Créer un dépôt.

  3. Sur la page CRÉER UN DÉPÔT, procédez comme suit :

    1. Dans le champ ID du dépôt, saisissez quickstart-production.

    2. Dans la liste Région, sélectionnez europe-west4.

    3. Cliquez sur Créer.

  4. Cliquez sur OK.

Accorder à Dataform l'accès à BigQuery

Pour exécuter des workflows dans BigQuery, le compte de service Dataform doit disposer des rôles suivants:

Pour attribuer ces rôles, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page IAM.

    Accéder à la page IAM

  2. Cliquez sur Ajouter.

  3. Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service Dataform.

  4. Dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Utilisateur de tâche BigQuery.

  5. Cliquez sur Ajouter un autre rôle, puis choisissez le rôle Éditeur de données BigQuery dans la liste déroulante Sélectionner un rôle.

  6. Cliquez sur Ajouter un autre rôle, puis choisissez le rôle Lecteur de données BigQuery dans la liste déroulante Sélectionner un rôle.

  7. Cliquez sur Enregistrer.

Créer une configuration de version

Pour créer les résultats de la compilation en production du dépôt quickstart-production, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations des versions, puis sur Nouvelle configuration de version.

  4. Dans le volet Créer une configuration de version, configurez les paramètres suivants:

    1. Dans le champ ID de version, saisissez production.

    2. Dans le champ Commitish Git, conservez la valeur par défaut main .

    3. Dans la liste déroulante Fréquence, sélectionnez Personnalisée.

    4. Dans le champ Planification personnalisée, saisissez 0 16 * * *.

    5. Dans le menu déroulant Fuseau horaire, sélectionnez un fuseau horaire UTC+1. Par exemple, GMT (heure du méridien de Greenwich).

    Tous les jours à 16h UTC+1, Dataform compile le dépôt quickstart-production et applique les paramètres de compilation configurés dans cette configuration de version pour créer des résultats de compilation production.

  5. Cliquez sur Créer.

La configuration de version production crée un résultat de compilation pour l'ensemble du dépôt quickstart-production tous les jours à 16h UTC+1.

Créer une configuration de workflow

Pour planifier l'exécution de tables production, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations de workflow, puis sur Nouvelle configuration de workflow.

  4. Dans le volet Create workflow configuration (Créer une configuration de workflow), saisissez production dans le champ Configuration ID (ID de configuration).

  5. Dans le menu déroulant Configuration de version, sélectionnez production.

  6. Dans le champ Fréquence, saisissez 0 17 * * *.

  7. Dans le menu déroulant Fuseau horaire, sélectionnez un fuseau horaire UTC+1. Par exemple, GMT (heure du méridien de Greenwich).

    Chaque jour, à 17h UTC+1, Dataform exécute le dernier résultat de compilation production du dépôt quickstart-production.

    Pour vous assurer que Dataform exécute le dernier résultat de compilation dans la configuration de version correspondante, laissez un délai d'au moins une heure entre le moment de la création du résultat de compilation et l'heure de l'exécution planifiée.

  8. Cliquez sur Toutes les actions.

    Dataform exécute toutes les actions de workflow SQL dans le résultat de compilation production.

  9. Cliquez sur Créer.

La configuration du workflow production exécute l'intégralité du résultat de compilation le plus récent créé par la configuration de version production tous les jours à 16h UTC+1.

Afficher les précédents résultats de compilation production

Pour afficher les anciens résultats de la compilation production planifiée, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations des versions.

  4. Cliquez sur production.

Afficher les exécutions précédentes du workflow production

Pour afficher les exécutions précédentes du workflow production, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations de workflow.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud , procédez comme suit :

Supprimer l'ensemble de données créé dans BigQuery

Pour éviter que des frais liés aux éléments BigQuery ne vous soient facturés, procédez comme suit afin de supprimer l'ensemble de données dataform_production:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le panneau Explorateur, développez votre projet et sélectionnez dataform_production.

  3. Cliquez sur le menu Actions, puis sélectionnez Supprimer.

  4. Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez delete, puis cliquez sur Supprimer.

Supprimer la configuration de version Dataform

La création de configurations de version Dataform n'engendre aucuns frais. Toutefois, si vous souhaitez supprimer la configuration de version production, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations des versions.

  4. À côté de la configuration de version production, cliquez sur le menu Plus, puis sur Supprimer.

  5. Dans la boîte de dialogue Supprimer la configuration de version, cliquez sur Supprimer.

Supprimer la configuration de workflow Dataform

Pour éviter que des frais liés aux éléments BigQuery ne vous soient facturés, procédez comme suit afin de supprimer la configuration de workflow Dataform production :

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. Cliquez sur quickstart-production.

  3. Cliquez sur Configurations de workflow.

  4. À côté de la configuration de workflow production, cliquez sur le menu Plus, puis sur Supprimer.

  5. Dans la boîte de dialogue Supprimer la configuration de version, cliquez sur Supprimer.

Supprimer le dépôt Dataform

La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform page.

    Accéder à Dataform

  2. À côté de quickstart-production, cliquez sur le menu Plus, puis sélectionnez Supprimer.

  3. Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.

  4. Pour confirmer l'opération, cliquez sur Supprimer.

Étape suivante