Créer des environnements de développement
Ce guide de démarrage rapide vous explique les étapes à suivre pour créer un développement individuel dans Dataform, de sorte que chaque développeur puisse travailler à son propre développement d'applications:
- Créer un Dataform un dépôt de clés.
Accorder à Dataform l'accès à dans BigQuery.
Configurer des remplacements de compilation que Dataform appliquera à tous des espaces de travail dans votre dépôt, les transformant environnements de développement Google Cloud.
Avant de commencer
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Activer les API BigQuery and Dataform.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Activer les API BigQuery and Dataform.
Rôles requis
Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous accorder le les rôles IAM suivants sur votre projet:
-
Administrateur Dataform (
roles/dataform.admin
) – Dépôts -
Éditeur Dataform (
roles/dataform.editor
) : espaces de travail et appels de workflow
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Créer un dépôt Dataform
Dans la console Google Cloud, accédez à la page Dataform page.
Cliquez sur
Créer un dépôt.Sur la page Créer un dépôt, procédez comme suit:
Dans le champ ID du dépôt, saisissez
quickstart-dev
.Dans la liste Région, sélectionnez
europe-west4
.Cliquez sur Créer.
Cliquez sur OK.
Accorder à Dataform l'accès à BigQuery
Pour exécuter des workflows dans BigQuery, Dataform compte de service doit disposer des rôles requis suivants:
- Éditeur de données BigQuery sur les projets pour lesquels Dataform a besoin d'un accès en lecture et en écriture. Ils qui incluent généralement le projet qui héberge votre dépôt Dataform.
- Lecteur de données BigQuery sur les projets pour lesquels Dataform a besoin d'un accès en lecture seule.
- Utilisateur de job BigQuery sur le projet hébergeant votre dépôt Dataform.
Pour attribuer ces rôles, procédez comme suit:
Dans la console Google Cloud, accédez à la page IAM.
Cliquez sur Ajouter.
Dans le champ Nouveaux comptes principaux, saisissez votre service Dataform. ID de compte Google Ads.
Dans la liste déroulante Sélectionner un rôle, sélectionnez le rôle Rôle Utilisateur de tâche BigQuery.
Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionnez un rôle. sélectionnez le rôle Éditeur de données BigQuery.
Cliquez sur Ajouter un autre rôle, puis dans la liste déroulante Sélectionnez un rôle. sélectionnez le rôle Lecteur de données BigQuery.
Cliquez sur Enregistrer.
Configurer des remplacements de compilation d'espace de travail
Créer des environnements de développement isolés avec un espace de travail Dataform de compilation, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform page.
Cliquez sur
quickstart-dev
.Cliquez sur Paramètres, puis sur Modifier.
Dans le volet Remplacements de compilation d'espace de travail, saisissez
${workspaceName}
dans le champ Suffixe du schéma.Lorsque vous déclenchez l'exécution dans un espace de travail, Dataform ajoute la méthode nom de l'espace de travail en tant que suffixe du schéma par défaut défini dans paramètres du workflow. Ce guide de démarrage rapide utilise les paramètres Dataform par défaut avec le schéma par défaut
dataform
.Cliquez sur Enregistrer.
Dataform applique des remplacements de compilation d'espace de travail à tous les espaces de travail de dans votre dépôt.
Avec cette configuration, lorsque vous exécutez manuellement un workflow SQL dans un
Dataform l'exécute avec des remplacements de compilation d'espace de travail.
Par conséquent, Dataform exécute le workflow SQL dans le schéma dataform_workspaceName
dans BigQuery, transformant ainsi
dans un environnement de développement isolé.
Par exemple, lorsque vous déclenchez manuellement l'exécution dans un espace de travail sasha
,
Dataform exécute votre workflow SQL dans le schéma dataform_sasha
dans
dans BigQuery.
Pour exécuter des workflows SQL sans remplacements de compilation d'espace de travail, mais conserver
compilation d'espace de travail pour les environnements de développement, vous pouvez créer
des configurations de lancement pour configurer d'autres environnements d'exécution, par exemple
staging
et production
.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :
Supprimer des ensembles de données créés dans BigQuery
Pour éviter que des frais ne vous soient facturés pour les éléments BigQuery, supprimez des ensembles de données
dont le nom commence par dataform
, par exemple dataform-sasha
.
Dans la console Google Cloud, accédez à la page BigQuery.
Dans le panneau Explorateur, développez votre projet et sélectionnez un ensemble de données.
Cliquez sur le menu Actions
, puis sélectionnez Supprimer.Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez
delete
dans le champ, puis cliquez sur Supprimer.
Supprimer le dépôt Dataform
La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit : étapes:
Dans la console Google Cloud, accédez à la page Dataform page.
À partir de
quickstart-dev
, cliquez sur le menu Plus, puis puis sélectionnez Supprimer.- Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.
Pour confirmer l'opération, cliquez sur Supprimer.
Étape suivante
Pour en savoir plus sur le cycle de vie du code dans Dataform, consultez Introduction au cycle de vie du code dans Dataform.
Pour en savoir plus sur les bonnes pratiques concernant le cycle de vie du code dans Dataform, consultez la section Gérer le cycle de vie du code.
Pour en savoir plus sur les remplacements de compilation d'espace de travail dans Dataform, Voir la section Créer une compilation d'espace de travail par défaut.
Pour savoir comment planifier des exécutions en production dans Dataform, consultez Programmer la production exécutions.