Ce document explique comment créer, définir et modifier un dépôt. compte de service et supprimer un dépôt dans Dataform.
Lorsque vous créez un dépôt Dataform, vous devez définir les paramètres suivants : paramètres du dépôt:
- ID du dépôt
- Identifiant unique du dépôt. Les ID ne peuvent contenir que des chiffres, des lettres, des tirets et des traits de soulignement.
- Région
Région Dataform pour le stockage du dépôt et de son contenu.
Cette région de stockage peut être différente de la région de traitement dans laquelle Dataform traite votre code et stocke le résultat des exécutions. Par défaut, la région de traitement est définie sur la région BigQuery par défaut la région de l'ensemble de données. Vous pouvez modifier la région de traitement dans le fichier de paramètres du workflow après la création du dépôt. Pour en savoir plus, consultez Configurez les paramètres Dataform.
- Compte de service
Compte de service associé au dépôt. Vous pouvez sélectionner un compte de service Dataform, un compte de service associé à votre un projet Google Cloud, ou saisissez manuellement un autre compte de service. Par défaut, Dataform utilise un compte de service dérivé de votre numéro de projet dans au format suivant:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform utilise le compte de service par défaut pour tous les dépôts opérations. Vous pouvez utiliser un autre compte de service pour exécuter des workflows dans votre dépôt, mais le compte de service par défaut est toujours utilisé pour d'autres opérations de dépôt.
- Chiffrement
Méthode de chiffrement du dépôt. Vous pouvez utiliser chiffrement par défaut : une clé de chiffrement Cloud KMS gérée par le client, ou une clé CMEK Dataform par défaut. Pour en savoir plus sur l'utilisation des clés de chiffrement gérées par le client (CMEK) Dataform, consultez Utiliser des clés de chiffrement gérées par le client.
Après avoir créé un dépôt, vous pouvez l'associer à GitHub ou GitLab.
Avant de commencer
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
- Pour utiliser le chiffrement CMEK pour le dépôt, activez le chiffrement CMEK des dépôts Dataform.
Rôles requis
Pour obtenir les autorisations dont vous avez besoin
pour créer et supprimer un dépôt,
demandez à votre administrateur de vous accorder le
Rôle IAM Administrateur Dataform (roles/dataform.admin
) sur les dépôts.
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Pour utiliser un compte de service autre que le service Dataform par défaut accordez l'accès au compte de service personnalisé.
Créer un dépôt
Pour créer un dépôt Dataform, procédez comme suit:
Dans la console Google Cloud, accédez à la page Dataform page.
Cliquez sur Créer un dépôt.
Sur la page Créer un dépôt, dans le champ ID du dépôt, saisissez un identifiant unique.
Les ID ne peuvent contenir que des chiffres, des lettres, des traits d'union et des traits de soulignement.
Dans la liste déroulante Région, sélectionnez une région Dataform pour stocker le dépôt et son contenu. Sélectionnez la région Dataform la plus proche de votre position.
Pour obtenir la liste des régions Dataform disponibles, consultez Zones géographiques : La région du dépôt ne doit pas nécessairement correspondre à l'emplacement de vos ensembles de données BigQuery.
Dans le fichier
workflow_settings.yaml
, vous pouvez définir la région de traitement dans laquelle Dataform traite votre code et stocke le résultat des exécutions. La région de traitement doit correspondre à l'emplacement ensembles de données, mais il n'a pas besoin de correspondre à la région du dépôt. Pour en savoir plus, consultez Configurez les paramètres Dataform.Dans le menu déroulant Service account (Compte de service), sélectionnez un compte de service pour le dépôt.
Dans le menu déroulant, vous pouvez sélectionner le compte de service Dataform par défaut ou tout compte de service associé à votre projet Google Cloud auquel vous avez accès. N'oubliez pas que les comptes de service personnalisés ne sont utilisés que pour l'exécution des workflows. Toutes les autres opérations de dépôt sont toujours effectuées par le compte de service Dataform par défaut.
- Facultatif : Pour sélectionner un compte de service qui n'apparaît pas dans la liste déroulante, procédez comme suit : cliquez sur Saisir manuellement et indiquez un ID de compte de service.
Configurez le mécanisme de chiffrement sélectionné pour le dépôt:
Clé CMEK par défaut
Dataform affiche la case Utiliser la clé KMS par défaut et la sélectionne par défaut.
- Pour chiffrer le dépôt avec la clé CMEK Dataform par défaut, laissez la case Utiliser la clé KMS par défaut cochée.
Clé CMEK unique
Pour chiffrer le dépôt avec une clé CMEK unique, procédez comme suit :
- Si la case Utiliser la clé KMS par défaut est cochée par défaut, décochez la case.
- Dans la section Encryption (Chiffrement), sélectionnez l'option Customer-managed encryption keys (CMEK) (Clés de chiffrement gérées par le client (CMEK)).
- Dans la liste déroulante Sélectionner une clé gérée par le client, sélectionnez une clé CMEK unique.
Chiffrement au repos
- Pour utiliser le chiffrement par défaut, dans la section Chiffrement, sélectionnez l'option Clé de chiffrement gérée par Google.
Cliquez sur Créer, puis sur OK.
Modifier le compte de service
Vous pouvez associer un compte de service personnalisé à un Dataform pour exécuter le workflow. Toutes les autres opérations de dépôt sont par le compte de service Dataform par défaut.
Pour modifier le compte de service d'un dépôt Dataform, procédez comme suit :
Dans la console Google Cloud, accédez à la page Dataform page.
Sélectionnez un dépôt, puis cliquez sur Paramètres.
Dans le champ Compte de service, cliquez sur
Modifier le compte de service.Dans le menu déroulant Service account (Compte de service), sélectionnez un compte de service pour le dépôt.
Dans la liste déroulante, vous pouvez sélectionner le compte de service Dataform par défaut. ou tout compte de service associé à votre projet Google Cloud y accéder.
- Facultatif : Pour sélectionner un compte de service qui ne s'affiche pas dans le menu déroulant, cliquez sur Saisir manuellement, puis saisissez un ID de compte de service.
Cliquez sur Enregistrer.
Supprimer un dépôt
Pour supprimer un dépôt et tout son contenu, procédez comme suit :
Dans la console Google Cloud, accédez à la page Dataform page.
À côté du dépôt que vous souhaitez supprimer, cliquez sur le bouton
dans le menu Plus, puis sélectionnez Supprimer.Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.
Cliquez sur Supprimer.
Étape suivante
Pour savoir comment configurer les paramètres de traitement Dataform, consultez Configurer les paramètres Dataform.
Pour savoir comment associer un dépôt Dataform à un fournisseur Git tiers, consultez la page Se connecter à un dépôt Git tiers.
Pour en savoir plus sur l'utilisation des clés CMEK dans Dataform, consultez Utilisez des clés de chiffrement gérées par le client.
Pour savoir comment créer un espace de travail de développement, consultez Créez un espace de travail.