Créer une instance publique

Vous trouverez sur cette page la procédure à suivre pour créer une instance Cloud Data Fusion.

Avant de commencer

  • Activez l'API Cloud Data Fusion.
  • L'autorisation suivante est requise pour créer des instances Cloud Data Fusion : instances.create. Pour plus d'informations, consultez la section Contrôle des accès.
  • Les instances Cloud Data Fusion s'exécutent en tant que compte de service par défaut de Compute Engine. Pour en savoir plus sur les types et les rôles disponibles, consultez la page Comptes de service.
  • Par défaut, Cloud Data Fusion exécute des pipelines à l'aide d'un cluster Dataproc dans votre projet. Assurez-vous que votre projet répond aux exigences de mise en réseau Dataproc.
  • Les nouveaux projets démarrent avec un réseau par défaut. Le réseau par défaut est prérempli avec une règle de pare-feu default-allow-ssh, qui autorise les connexions entrantes sur le port TCP 22 depuis toutes les sources vers toutes les instances du réseau. Dans les versions antérieures à la version 6.2.0, si cette règle autorisant le trafic entrant sur le port TCP 22 n'existe pas dans le réseau utilisé par votre instance Cloud Data Fusion, vous devez créer cette règle.

Créer une instance

Console

Si l'API est activée, la section Cloud Data Fusion de la console Google Cloud affiche une page Instances, dans laquelle vous pouvez créer et gérer vos instances Cloud Data Fusion.

  1. Dans la console, accédez à la page Cloud Data Fusion.
  2. Cliquez sur Instances, puis sur Créer une instance.

    Créer une instance

  3. Saisissez un Nom d'instance.
  4. Saisissez une Description pour votre instance.
  5. Spécifiez la Région dans laquelle créer l'instance.
  6. Spécifiez la version de Cloud Data Fusion.
  7. Sélectionnez une édition. La valeur par défaut est Basic.
  8. Facultatif: Cliquez sur Ajouter des accélérateurs pour sélectionner les accélérateurs à utiliser dans votre instance.
  9. Spécifiez le compte de service Dataproc à utiliser pour exécuter votre pipeline Cloud Data Fusion dans Dataproc. La valeur par défaut est le compte Compute Engine. Quelle que soit la version, assurez-vous que le compte de service dispose des rôles Identity and Access Management appropriés à vos besoins. Pour en savoir plus, consultez la page Accorder l'autorisation de l'utilisateur du compte de service.
  10. Facultatif: Spécifiez les options avancées. Si vous ne spécifiez rien, les valeurs par défaut suivantes sont utilisées:

    Catégorie Paramètre Description Par défaut
    Adresse IP privée Activer les adresses IP internes Créez l'instance Cloud Data Fusion avec une adresse IP interne. Désactivé
    Journalisation et surveillance Activer Cloud Logging Affichez les journaux du pipeline dans Cloud Logging. Désactivé
    Intégration de la traçabilité des données Dataplex Activer ou désactiver l'intégration avec la traçabilité des données Dataplex Affichez la traçabilité dans Dataplex. Désactivé
    Chiffrement Utiliser une clé de chiffrement gérée par le client (CMEK) Utilisez le contrôle des accès basé sur les rôles dans les versions 6.5 et ultérieures. Désactivé
    Étiquettes Une paire clé-valeur Libellés de ressources que l'instance doit utiliser pour annoter les ressources sous-jacentes associées, telles que les VM Compute Engine. Les clés et les valeurs de libellés ne peuvent contenir que des lettres, des chiffres, des tirets et des traits de soulignement. Les clés d'étiquette doivent commencer par une lettre ou un chiffre. Aucune
  11. Cliquez sur Créer. Le processus de création de l'instance peut prendre jusqu'à 30 minutes.

Pendant que Cloud Data Fusion crée votre instance, une icône de progression en forme de roue s'affiche à côté du nom de l'instance sur la page Instances. Une fois l'opération terminée, une coche verte s'affiche à la place de la roue et indique que vous pouvez commencer à utiliser l'instance.

API

Créer une instance

Pour créer une instance Cloud Data Fusion avec l'API REST Cloud Data Fusion, effectuez une requête API instances.create en spécifiant vos informations de configuration dans le champ de la ressource Instance.

Étapes suivantes