Vous trouverez sur cette page la procédure à suivre pour créer une instance Cloud Data Fusion.
Avant de commencer
- Activez l'API Cloud Data Fusion.
- L'autorisation suivante est requise pour créer des instances Cloud Data Fusion :
instances.create
. Pour plus d'informations, consultez la section Contrôle des accès. - Les instances Cloud Data Fusion s'exécutent en tant que compte de service par défaut de Compute Engine. Pour en savoir plus sur les types et les rôles disponibles, consultez la page Comptes de service.
- Par défaut, Cloud Data Fusion exécute des pipelines à l'aide d'un cluster Dataproc dans votre projet. Assurez-vous que votre projet répond aux exigences de mise en réseau Dataproc.
- Les nouveaux projets démarrent avec un réseau par défaut. Le réseau par défaut est prérempli avec une règle de pare-feu default-allow-ssh, qui autorise les connexions entrantes sur le port TCP 22 depuis toutes les sources vers toutes les instances du réseau. Dans les versions antérieures à 6.2.0, si cette règle autorise le trafic entrant sur TCP le port 22 n'existe pas dans le réseau utilisé par votre instance Cloud Data Fusion vous devez créer cette règle.
Créer une instance
Console
Si l'API est activée, la section Cloud Data Fusion de la console Google Cloud affiche une page Instances sur laquelle vous pouvez créer et gérer vos instances Cloud Data Fusion.
- Dans la console, accédez à la page Cloud Data Fusion.
- Cliquez sur Instances, puis sur Créer une instance.
- Saisissez un Nom d'instance.
- Saisissez une Description pour votre instance.
- Spécifiez la Région dans laquelle créer l'instance.
- Spécifiez la version de Cloud Data Fusion.
- Sélectionnez une édition. La valeur par défaut est Basic.
- Facultatif: cliquez sur Ajouter des accélérateurs pour sélectionner les accélérateurs à utiliser dans votre instance.
- Spécifiez le compte de service Dataproc à utiliser pour exécuter votre pipeline Cloud Data Fusion dans Dataproc. Par défaut, le compte Compute Engine est utilisé. Quelle que soit la version, assurez-vous que le compte de service dispose des rôles Identity and Access Management appropriés à vos besoins. Pour en savoir plus, consultez la page Accorder l'autorisation de l'utilisateur du compte de service.
Facultatif: spécifiez les options avancées, le cas échéant. Si vous ne spécifiez rien, les valeurs par défaut suivantes sont utilisées :
Catégorie Paramètre Description Par défaut Adresse IP privée Activer les adresses IP internes Créez le Instance Cloud Data Fusion avec une adresse IP interne. Désactivé Journalisation et surveillance Activer Cloud Logging Afficher les journaux de pipeline dans Cloud Logging. Désactivé Traçabilité des données Dataplex intégration Activer ou désactiver l'intégration avec la traçabilité des données Dataplex Afficher la traçabilité dans Dataplex. Désactivé Chiffrement Utiliser une clé de chiffrement gérée par le client (CMEK) Utiliser le contrôle des accès basé sur les rôles à partir de la version 6.5. Désactivé Libellés Une paire clé-valeur Libellés de ressources à utiliser par l'instance pour annoter les ressources sous-jacentes associées, telles que les VM Compute Engine. Les clés et valeurs d'étiquettes ne peuvent contenir que des lettres, des chiffres, des tirets et des traits de soulignement. Les clés de libellé doivent commencer par une lettre ou un chiffre. Aucun Maintenance Activer l'intervalle de maintenance Définissez la période pendant laquelle Cloud Data Fusion peut effectuer les opérations de maintenance sur l'instance. Pour en savoir plus, consultez la section Configurer les intervalles de maintenance. Désactivé Cliquez sur Créer. Le processus de création de l'instance peut prendre jusqu'à 30 minutes.
Pendant que Cloud Data Fusion crée votre instance, une icône de progression en forme de roue s'affiche à côté du nom de l'instance sur la page Instances. Une fois l'opération terminée, une coche verte s'affiche à la place de la roue et indique que vous pouvez commencer à utiliser l'instance.
API
Créer une instance
Pour créer une instance Cloud Data Fusion avec l'API REST Cloud Data Fusion, effectuez une requête API instances.create
en spécifiant vos informations de configuration dans le champ de la ressource Instance
.
Étape suivante
- Apprenez-en plus sur Cloud Data Fusion.
- Suivez un tutoriel.