L'autorisation suivante est requise pour créer des instances Cloud Data Fusion : instances.create. Pour plus d'informations, consultez la section Contrôle des accès.
Par défaut, Cloud Data Fusion exécute des pipelines à l'aide d'un cluster Dataproc dans votre projet. Assurez-vous que votre projet répond aux exigences de mise en réseau Dataproc.
Les nouveaux projets démarrent avec un réseau par défaut.
Le réseau par défaut est prérempli avec une règle de pare-feu default-allow-ssh, qui autorise les connexions entrantes sur le port TCP 22 depuis toutes les sources vers toutes les instances du réseau. Dans les versions antérieures à 6.2.0, si cette règle autorisant le trafic d'entrée sur le port TCP 22 n'existe pas dans le réseau utilisé par votre instance Cloud Data Fusion, vous devez créer cette règle.
Créer une instance
Console
Si l'API est activée, la section Cloud Data Fusion de la Google Cloud console affiche une page Instances, sur laquelle vous pouvez créer et gérer vos instances Cloud Data Fusion.
Dans la console, accédez à la page Cloud Data Fusion.
Cliquez sur Instances, puis sur Créer une instance.
Sélectionnez une édition.
La valeur par défaut est Basic.
Facultatif: cliquez sur Ajouter des accélérateurs pour sélectionner les accélérateurs à utiliser dans votre instance.
Spécifiez le compte de service Dataproc à utiliser pour exécuter votre pipeline Cloud Data Fusion dans Dataproc. Par défaut, le compte Compute Engine est utilisé. Quelle que soit la version, assurez-vous que le compte de service dispose des rôles Identity and Access Management appropriés à vos besoins. Pour en savoir plus, consultez la page Accorder l'autorisation de l'utilisateur du compte de service.
(Facultatif) Spécifiez les options avancées. Si vous ne spécifiez rien, les valeurs par défaut suivantes sont utilisées:
Libellés de ressources à utiliser par l'instance pour annoter les ressources sous-jacentes associées, telles que les VM Compute Engine. Les clés et les valeurs de libellé ne peuvent contenir que des lettres, des chiffres, des tirets et des traits de soulignement. Les clés de libellé doivent commencer par une lettre ou un chiffre.
Aucun
Maintenance
Activer l'intervalle de maintenance
Définissez la période pendant laquelle Cloud Data Fusion peut effectuer des opérations de maintenance sur l'instance. Pour en savoir plus, consultez la section
Configurer les intervalles de maintenance.
Désactivé
Cliquez sur Créer. Le processus de création de l'instance peut prendre jusqu'à 30 minutes.
Pendant que Cloud Data Fusion crée votre instance, une icône de progression en forme de roue s'affiche à côté du nom de l'instance sur la page Instances. Une fois l'opération terminée, une coche verte s'affiche à la place de la roue et indique que vous pouvez commencer à utiliser l'instance.
API
Créer une instance
Pour créer une instance Cloud Data Fusion avec l'API REST Cloud Data Fusion, effectuez une requête API instances.create en spécifiant vos informations de configuration dans le champ de la ressource Instance.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eThis page details the process of creating a Cloud Data Fusion instance, covering prerequisites, console setup, and API methods.\u003c/p\u003e\n"],["\u003cp\u003eBefore creating an instance, users must enable the Cloud Data Fusion API and ensure they have the necessary \u003ccode\u003einstances.create\u003c/code\u003e permission.\u003c/p\u003e\n"],["\u003cp\u003eWhen creating an instance, users can specify various configurations, such as the instance name, region, version, edition, and advanced options like private IP and logging.\u003c/p\u003e\n"],["\u003cp\u003eInstance creation can be done via the Google Cloud console, navigating to the Cloud Data Fusion Instances page and selecting "Create an instance," or via a REST API request.\u003c/p\u003e\n"],["\u003cp\u003eAfter an instance is created, certain advanced options like Cloud Logging and Private IP cannot be added or removed and must be handled through an API \u003ccode\u003ePATCH\u003c/code\u003e method.\u003c/p\u003e\n"]]],[],null,["# Create a public instance\n\nThis page explains how to create a Cloud Data Fusion\n[instance](/data-fusion/docs/concepts/overview).\n\nBefore you begin\n----------------\n\n- [Enable the Cloud Data Fusion API](/data-fusion/docs/how-to/enable-service).\n- The following permission is required to create Cloud Data Fusion instances: `instances.create`. For more information, see [Access control](/data-fusion/docs/access-control).\n- Cloud Data Fusion instances run as the [Compute Engine\n default service account](/compute/docs/access/service-accounts#compute_engine_default_service_account). For information about the types and roles available, see [Service accounts](/iam/docs/service-account-types#google-managed_service_accounts).\n- By default, Cloud Data Fusion executes pipelines using a Dataproc cluster in your project. Ensure that your project meets the [Dataproc networking requirements](/dataproc/docs/concepts/configuring-clusters/network).\n- New projects start with a [default network](/vpc/docs/vpc#default-network). The default network is pre-populated with a firewall rule [default-allow-ssh](/vpc/docs/firewalls#more_rules_default_vpc), that allows incoming connections on TCP port 22 from any source to any instance in the network. In versions earlier than 6.2.0, if this rule to allow ingress on TCP port 22 doesn't exist in the network used by your Cloud Data Fusion instance, you must [create this rule](/vpc/docs/using-firewalls#creating_firewall_rules).\n\nCreate an instance\n------------------\n\n**Caution:** After you create a Cloud Data Fusion instance, you cannot change its edition. \n\n### Console\n\nIf the [API is enabled](/data-fusion/docs/how-to/enable-service), the\nCloud Data Fusion section in the Google Cloud console shows an\n**Instances** page, where you can create and manage your\nCloud Data Fusion instances.\n\n1. In the console, go to the Cloud Data Fusion page.\n2. Click **Instances** , and then click **Create an instance** .\n\n [Create an instance](https://console.cloud.google.com/data-fusion/instance-create)\n3. Enter an **Instance name**.\n4. Enter a **Description** for your instance.\n5. Specify the **Region** in which to create the instance.\n6. Specify the Cloud Data Fusion [**Version**](/data-fusion/docs/release-notes).\n7. Select an [**Edition**](/data-fusion/pricing). The default is **Basic**.\n8. Optional: Click **Add accelerators** to select accelerators to use in your instance.\n9. Specify the [**Dataproc service account**](/dataproc/docs/concepts/configuring-clusters/service-accounts) to use for running your Cloud Data Fusion pipeline in Dataproc. The default is the Compute Engine account. Regardless of version, make sure that a service account has appropriate Identity and Access Management roles for your needs. For more information, see [Granting service account user permission](/data-fusion/docs/how-to/granting-service-account-permission).\n10. Optional: Specify any advanced options. If you don't specify anything,\n the following defaults are used:\n\n11. Click **Create**. It takes up to 30 minutes for the instance\n creation process to complete.\n\nWhile Cloud Data Fusion creates your instance, a progress\nwheel displays next to the instance name on the **Instances** page. After\ncompletion, it turns into a green check mark and indicates that you can\nstart using the instance.\n| After you create an instance, you cannot add or remove the options for [Cloud Logging and Cloud Monitoring](/data-fusion/docs/how-to/viewing-stackdriver-logs#enabling-stackdriver) or [Private IP](/data-fusion/docs/how-to/create-private-ip). To update these options with the Cloud Data Fusion API, call the [`PATCH`](/data-fusion/docs/reference/rest/v1/projects.locations.instances/patch) method.\n\n### API\n\nCreate an instance:\n\nTo create a Cloud Data Fusion instance with the\n[Cloud Data Fusion REST API](/data-fusion/docs/reference/rest),\nconstruct an\n[`instances.create`](/data-fusion/docs/reference/rest/v1/projects.locations.instances/create)\nAPI request, filling in the\n[`Instance`](/data-fusion/docs/reference/rest/v1/projects.locations.instances#Instance)\nresource with your configuration information.\n\nWhat's next\n-----------\n\n- Learn more about [Cloud Data Fusion](/data-fusion/docs/concepts/overview).\n- Work through a [tutorial](/data-fusion/docs/tutorials/targeting-campaign-pipeline)."]]