Créer des environnements de développement

Ce guide de démarrage rapide vous explique comment créer des environnements de développement individuels dans Dataform, afin que chaque développeur puisse travailler dans son propre environnement de développement:

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  4. Activer les API BigQuery and Dataform.

    Activer les API

  5. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  6. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  7. Activer les API BigQuery and Dataform.

    Activer les API

Rôles requis

Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous attribuer les rôles IAM suivants:

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Créer un dépôt Dataform

  1. Dans la console Google Cloud, accédez à la page Dataform.

    Accéder à Dataform

  2. Cliquez sur Créer un dépôt.

  3. Sur la page Créer un dépôt, procédez comme suit:

    1. Dans le champ ID du dépôt, saisissez quickstart-dev.

    2. Dans la liste Région, sélectionnez europe-west4.

    3. Cliquez sur Créer.

  4. Cliquez sur OK.

Accorder à Dataform l'accès à BigQuery

Pour exécuter des workflows dans BigQuery, le compte de service Dataform doit disposer des rôles requis suivants:

Pour attribuer ces rôles, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page IAM.

    Accéder à la page IAM

  2. Cliquez sur Ajouter.

  3. Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service Dataform.

  4. Dans la liste déroulante Sélectionnez un rôle, sélectionnez le rôle Utilisateur de job BigQuery.

  5. Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Éditeur de données BigQuery.

  6. Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Lecteur de données BigQuery.

  7. Cliquez sur Enregistrer.

Configurer des remplacements de compilation d'espace de travail

Pour créer des environnements de développement isolés avec des remplacements de compilation d'espace de travail Dataform, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform.

    Accéder à Dataform

  2. Cliquez sur quickstart-dev.

  3. Cliquez sur Paramètres, puis sur Modifier.

  4. Dans le volet Remplacements de compilation d'espace de travail, saisissez ${workspaceName} dans le champ Suffixe du schéma.

    Lorsque vous déclenchez l'exécution dans un espace de travail, Dataform ajoute le nom de l'espace de travail sous forme de suffixe à l'ensemble de schémas par défaut dans dataform.json. Ce guide de démarrage rapide utilise les paramètres Dataform par défaut avec le schéma par défaut dataform.

  5. Cliquez sur Enregistrer.

Dataform applique des remplacements de compilation d'espace de travail à tous les espaces de travail de votre dépôt.

Avec cette configuration, lorsque vous exécutez manuellement un workflow SQL dans un espace de travail, Dataform l'exécute avec des remplacements de compilation d'espace de travail. Par conséquent, Dataform exécute le workflow SQL dans le schéma dataform_workspaceName de BigQuery, transformant l'espace de travail en un environnement de développement isolé.

Par exemple, lorsque vous déclenchez manuellement l'exécution dans un espace de travail sasha, Dataform exécute votre workflow SQL dans le schéma dataform_sasha de BigQuery.

Pour exécuter des workflows SQL sans remplacements de compilation d'espace de travail, mais conserver les remplacements de compilation d'espace de travail pour les environnements de développement, vous pouvez créer des configurations de version pour configurer d'autres environnements d'exécution, par exemple staging et production.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :

Supprimer des ensembles de données créés dans BigQuery

Pour éviter que des frais ne vous soient facturés pour les éléments BigQuery, supprimez les ensembles de données dont le nom commence par dataform (par exemple, dataform-sasha).

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le panneau Explorateur, développez votre projet et sélectionnez un ensemble de données.

  3. Cliquez sur le menu Actions , puis sélectionnez Supprimer.

  4. Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez delete dans le champ, puis cliquez sur Supprimer.

Supprimer le dépôt Dataform

La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Dataform.

    Accéder à Dataform

  2. Dans quickstart-dev, cliquez sur le menu Plus, puis sélectionnez Supprimer.

    1. Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.
  3. Pour confirmer l'opération, cliquez sur Supprimer.

Étapes suivantes