Créer une instance Cloud Data Fusion

Vous trouverez sur cette page la procédure à suivre pour créer une instance Cloud Data Fusion.

Avant de commencer

  • Activez l'API Cloud Data Fusion.
  • L'autorisation suivante est requise pour créer des instances Cloud Data Fusion : instances.create. Pour plus d'informations, consultez la section Contrôle des accès.
  • Les instances Cloud Data Fusion s'exécutent en tant que compte de service par défaut de Compute Engine. Pour en savoir plus sur les types et les rôles disponibles, consultez la page Comptes de service.
  • Par défaut, Cloud Data Fusion exécute des pipelines à l'aide d'un cluster Dataproc dans votre projet. Assurez-vous que votre projet répond aux exigences de mise en réseau Dataproc.
  • Les nouveaux projets démarrent avec un réseau par défaut. Le réseau par défaut est pré-rempli avec une règle de pare-feu, default-allow-ssh, qui autorise les connexions entrantes sur le port TCP 22 depuis toutes les sources vers toutes les instances du réseau. Dans les versions antérieures à 6.2.0, si cette règle autorisant le trafic d'entrée sur le port TCP 22 n'existe pas dans le réseau utilisé par Cloud Data Fusion, vous devez créer cette règle.

Créer une instance

Console

Si l'API est activée, la section Cloud Data Fusion de Cloud Console affiche une page Instances dans laquelle vous pouvez créer et gérer vos instances Cloud Data Fusion.

  1. Cliquez sur Create an instance (Créer une instance).

    Accéder à la page "Créer une instance"

  2. Saisissez un Nom d'instance.
  3. Saisissez une Description pour votre instance.
  4. Spécifiez la Région dans laquelle créer l'instance.
  5. Spécifiez la Version Cloud Data Fusion de votre choix.
  6. Sélectionnez l'édition de votre choix. La valeur par défaut est Basic.
  7. Facultatif: Cliquez sur Ajouter des accélérateurs pour sélectionner les accélérateurs à utiliser dans votre instance.
  8. Dans Cloud Data Fusion version 6.2.3 et ultérieure, spécifiez le compte de service Dataproc à utiliser pour exécuter votre pipeline Cloud Data Fusion dans Dataproc. L'interface utilisateur présélectionne le compte Compute Engine par défaut. Quelle que soit la version, assurez-vous que le compte de service dispose des rôles Identity and Access Management appropriés à vos besoins. Pour en savoir plus, consultez la page Accorder l'autorisation de l'utilisateur du compte de service.
  9. (Facultatif) Indiquez des options avancées. Si vous ne spécifiez rien, les valeurs par défaut suivantes sont utilisées:

    Catégorie
    Paramètre
    Description
    Par défaut
    Adresse IP privée
    Activer les adresses IP privées
    Consultez plutôt la section Créer une instance privée.
    Désactivée
    Journalisation et surveillance Activer Cloud Logging
    Option permettant d'activer Cloud Logging pour afficher les journaux de pipeline.
    Désactivée
    Journalisation et surveillance
    Activer Cloud Monitoring
    Option permettant d'activer Monitoring
    Désactivée
    Chiffrement
    Utiliser une clé de chiffrement gérée par le client (CMEK)
    Option permettant d'utiliser le contrôle des accès basé sur les rôles dans les versions 6.5 et ultérieures
    Désactivée
    Libellés
    Paire(s) <Clé> <Valeur>
    Libellés de ressources à utiliser par l'instance pour annoter les ressources sous-jacentes associées, telles que les VM Compute Engine. Les clés et les valeurs de libellé ne peuvent contenir que des lettres, des chiffres, des tirets et des traits de soulignement. Les clés de libellé doivent commencer par une lettre ou un chiffre.
    Aucune
  10. Cliquez sur Create (Créer). Le processus de création de l'instance peut prendre jusqu'à 30 minutes.

Pendant que Cloud Data Fusion crée votre instance, une icône de progression en forme de roue s'affiche à côté du nom de l'instance sur la page Instances. Une fois l'opération terminée, une coche verte s'affiche à la place de la roue et indique que vous pouvez commencer à utiliser l'instance.

API

Créer une instance

Pour créer une instance Cloud Data Fusion avec l'API REST Cloud Data Fusion, effectuez une requête API instances.create en spécifiant vos informations de configuration dans le champ de la ressource Instance.

Étapes suivantes