Vous trouverez sur cette page la procédure à suivre pour créer une instance Cloud Data Fusion.
Avant de commencer
- Activez l'API Cloud Data Fusion.
- L'autorisation suivante est requise pour créer des instances Cloud Data Fusion :
instances.create
. Pour plus d'informations, consultez la section Contrôle des accès. - Les instances Cloud Data Fusion s'exécutent en tant que compte de service par défaut de Compute Engine. Pour en savoir plus sur les types et les rôles disponibles, consultez la page Comptes de service.
- Par défaut, Cloud Data Fusion exécute des pipelines à l'aide d'un cluster Dataproc dans votre projet. Assurez-vous que votre projet répond aux exigences de mise en réseau Dataproc.
- Les nouveaux projets démarrent avec un réseau par défaut. Le réseau par défaut est pré-rempli avec une règle de pare-feu, default-allow-ssh, qui autorise les connexions entrantes sur le port TCP 22 depuis toutes les sources vers toutes les instances du réseau. Dans les versions antérieures à 6.2.0, si cette règle autorisant le trafic d'entrée sur le port TCP 22 n'existe pas dans le réseau utilisé par Cloud Data Fusion, vous devez créer cette règle.
Créer une instance
Console
Si l'API est activée, la section Cloud Data Fusion de Cloud Console affiche une page Instances dans laquelle vous pouvez créer et gérer vos instances Cloud Data Fusion.
- Cliquez sur Create an instance (Créer une instance).
- Saisissez un Nom d'instance.
- Saisissez une Description pour votre instance.
- Spécifiez la Région dans laquelle créer l'instance.
- Spécifiez la Version Cloud Data Fusion de votre choix.
- Sélectionnez l'édition de votre choix. La valeur par défaut est Basic.
- Facultatif: Cliquez sur Ajouter des accélérateurs pour sélectionner les accélérateurs à utiliser dans votre instance.
- Dans Cloud Data Fusion version 6.2.3 et ultérieure, spécifiez le compte de service Dataproc à utiliser pour exécuter votre pipeline Cloud Data Fusion dans Dataproc. L'interface utilisateur présélectionne le compte Compute Engine par défaut. Quelle que soit la version, assurez-vous que le compte de service dispose des rôles Identity and Access Management appropriés à vos besoins. Pour en savoir plus, consultez la page Accorder l'autorisation de l'utilisateur du compte de service.
(Facultatif) Indiquez des options avancées. Si vous ne spécifiez rien, les valeurs par défaut suivantes sont utilisées:
Catégorie Paramètre Description Par défaut Adresse IP privée Activer les adresses IP privées Consultez plutôt la section Créer une instance privée. Désactivée Journalisation et surveillance Activer Cloud Logging Option permettant d'activer Cloud Logging pour afficher les journaux de pipeline.
Désactivée Journalisation et surveillance Activer Cloud Monitoring Option permettant d'activer Monitoring Désactivée Chiffrement Utiliser une clé de chiffrement gérée par le client (CMEK) Option permettant d'utiliser le contrôle des accès basé sur les rôles dans les versions 6.5 et ultérieures Désactivée Libellés Paire(s) <Clé> <Valeur> Libellés de ressources à utiliser par l'instance pour annoter les ressources sous-jacentes associées, telles que les VM Compute Engine. Les clés et les valeurs de libellé ne peuvent contenir que des lettres, des chiffres, des tirets et des traits de soulignement. Les clés de libellé doivent commencer par une lettre ou un chiffre. Aucune Cliquez sur Create (Créer). Le processus de création de l'instance peut prendre jusqu'à 30 minutes.
Pendant que Cloud Data Fusion crée votre instance, une icône de progression en forme de roue s'affiche à côté du nom de l'instance sur la page Instances. Une fois l'opération terminée, une coche verte s'affiche à la place de la roue et indique que vous pouvez commencer à utiliser l'instance.
API
Créer une instance
Pour créer une instance Cloud Data Fusion avec l'API REST Cloud Data Fusion, effectuez une requête API instances.create
en spécifiant vos informations de configuration dans le champ de la ressource Instance
.
Étapes suivantes
- Apprenez-en plus sur Cloud Data Fusion.
- Suivez un tutoriel.