Créer des environnements de développement
Ce guide de démarrage rapide vous explique comment créer des environnements de développement individuels dans Dataform afin que chaque développeur puisse travailler dans son propre environnement de développement :
- Créez un dépôt Dataform.
Accorder à Dataform l'accès à BigQuery
Configurez les remplacements de compilation que Dataform appliquera à tous les espaces de travail de votre dépôt, transformant ainsi les espaces de travail en environnements de développement isolés.
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
Administrateur Dataform (
roles/dataform.admin
) : dépôts -
Éditeur Dataform (
roles/dataform.editor
) : espaces de travail et appels de workflows Dans la console Google Cloud , accédez à la page Dataform.
Cliquez sur
Créer un dépôt.Sur la page CRÉER UN DÉPÔT, procédez comme suit :
Dans le champ ID du dépôt, saisissez
quickstart-dev
.Dans la liste Région, sélectionnez
europe-west4
.Cliquez sur Créer.
Cliquez sur OK.
- Éditeur de données BigQuery sur les projets pour lesquels Dataform a besoin d'un accès en lecture et en écriture. Ils incluent généralement le projet hébergeant votre dépôt Dataform.
- Lecteur de données BigQuery sur les projets auxquels Dataform doit avoir accès en lecture seule.
- Utilisateur de job BigQuery sur le projet hébergeant votre dépôt Dataform.
Dans la console Google Cloud , accédez à la page IAM.
Cliquez sur Ajouter.
Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service Dataform ou l'adresse e-mail de votre compte Google (aperçu).
Dans le menu Sélectionner un rôle, sélectionnez le rôle Utilisateur de tâche BigQuery.
Cliquez sur Ajouter un autre rôle, puis sélectionnez le rôle Éditeur de données BigQuery dans le menu Sélectionner un rôle.
Cliquez sur Ajouter un autre rôle, puis sélectionnez le rôle Lecteur de données BigQuery dans le menu Sélectionner un rôle.
Cliquez sur Enregistrer.
Dans la console Google Cloud , accédez à la page Dataform.
Cliquez sur
quickstart-dev
.Cliquez sur Paramètres, puis sur Modifier.
Dans le volet Remplacements de compilation d'espace de travail, saisissez
${workspaceName}
dans le champ Suffixe du schéma.Lorsque vous déclenchez l'exécution dans un espace de travail, Dataform ajoute le nom de l'espace de travail en tant que suffixe au schéma par défaut défini dans les paramètres du workflow. Ce guide de démarrage rapide utilise les paramètres Dataform par défaut avec le schéma par défaut
dataform
.Cliquez sur Enregistrer.
Dans la console Google Cloud , accédez à la page BigQuery.
Dans le panneau Explorateur, développez votre projet et sélectionnez un ensemble de données.
Cliquez sur le menu
Actions, puis sélectionnez Supprimer.Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez
delete
dans le champ, puis cliquez sur Supprimer.Dans la console Google Cloud , accédez à la page Dataform.
À côté de
quickstart-dev
, cliquez sur le menu Plus, puis sélectionnez Supprimer.- Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.
Pour confirmer l'opération, cliquez sur Supprimer.
Pour en savoir plus sur le cycle de vie du code dans Dataform, consultez Présentation du cycle de vie du code dans Dataform.
Pour en savoir plus sur les bonnes pratiques concernant le cycle de vie des workflows dans Dataform, consultez Bonnes pratiques concernant le cycle de vie des workflows.
Pour en savoir plus sur les remplacements de compilation d'espace de travail dans Dataform, consultez Créer des remplacements de compilation d'espace de travail.
Pour savoir comment planifier des exécutions en production dans Dataform, consultez Planifier des exécutions en production.
Rôles requis
Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous accorder les rôles IAM suivants sur votre projet :
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer un dépôt Dataform
Accorder à Dataform l'accès à BigQuery
Pour exécuter des workflows dans BigQuery, le compte de service Dataform ou votre compte Google (aperçu) doivent disposer des rôles requis suivants :
Pour attribuer ces rôles, procédez comme suit :
Configurer des remplacements de compilation d'espace de travail
Pour créer des environnements de développement isolés avec des remplacements de compilation d'espace de travail Dataform, procédez comme suit :
Dataform applique des remplacements de compilation d'espace de travail à tous les espaces de travail de votre dépôt.
Avec cette configuration, lorsque vous exécutez manuellement un workflow dans un espace de travail, Dataform l'exécute avec des remplacements de compilation d'espace de travail.
Par conséquent, Dataform exécute le workflow dans le schéma dataform_workspaceName
dans BigQuery, transformant l'espace de travail en environnement de développement isolé.
Par exemple, lorsque vous déclenchez manuellement l'exécution dans un espace de travail sasha
, Dataform exécute votre workflow dans le schéma dataform_sasha
de BigQuery.
Pour exécuter des workflows sans remplacement de compilation d'espace de travail tout en conservant les remplacements de compilation pour les environnements de développement, vous pouvez créer des configurations de version afin de configurer d'autres environnements d'exécution, par exemple staging
et production
.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud , procédez comme suit :
Supprimer les ensembles de données créés dans BigQuery
Pour éviter que des frais liés aux éléments BigQuery ne vous soient facturés, supprimez les ensembles de données dont le nom commence par dataform
(par exemple, dataform-sasha
).
Supprimer le dépôt Dataform
La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit :