Zum Erstellen von Cloud Data Fusion-Instanzen ist die folgende Berechtigung erforderlich: instances.create. Weitere Informationen finden Sie unter Zugriffssteuerung.
Cloud Data Fusion führt standardmäßig Pipelines mithilfe eines Dataproc-Clusters in Ihrem Projekt aus. Prüfen Sie, ob Ihr Projekt die Dataproc-Netzwerkanforderungen erfüllt.
Neue Projekte beginnen mit einem Standardnetzwerk.
Das Standardnetzwerk enthält bereits die Firewallregel default-allow-ssh, die eingehende Verbindungen am TCP-Port 22 von jeder Quelle zu jeder Instanz im Netzwerk zulässt. Wenn bei Versionen, die älter als 6.2.0 sind, diese Regel, eingehenden Traffic an TCP-Port 22 zu erlauben, in dem von Ihrer Cloud Data Fusion-Instanz verwendeten Netzwerk nicht vorhanden ist, müssen Sie diese Regel erstellen.
Instanz erstellen
Console
Wenn die API aktiviert ist, wird im Abschnitt „Cloud Data Fusion“ in der Google Cloud Console die Seite Instanzen angezeigt, auf der Sie Cloud Data Fusion-Instanzen erstellen und verwalten können.
Rufen Sie in der Console die Seite „Cloud Data Fusion“ auf.
Klicken Sie auf Instanzen und dann auf Instanz erstellen.
Wählen Sie eine Version aus.
Die Standardeinstellung ist Basic.
Optional: Klicken Sie auf Beschleuniger hinzufügen, um Beschleuniger auszuwählen, die in Ihrer Instanz verwendet werden sollen.
Geben Sie das Dataproc-Dienstkonto an, das zum Ausführen Ihrer Cloud Data Fusion-Pipeline in Dataproc verwendet werden soll. Standardmäßig ist das Compute Engine-Konto ausgewählt. Sorgen Sie unabhängig von der Version dafür, dass ein Dienstkonto die entsprechenden Rollen für die Identitäts- und Zugriffsverwaltung hat. Weitere Informationen finden Sie unter Berechtigungen für Dienstkontonutzer erteilen.
Optional: Geben Sie erweiterte Optionen an. Wenn Sie nichts angeben, werden die folgenden Standardeinstellungen verwendet:
Die Ressourcenlabels für die Instanz, die zum Annotieren zugehöriger zugrunde liegender Ressourcen wie Compute Engine-VMs verwendet werden. Labelschlüssel und Labelwerte dürfen nur Buchstaben, Zahlen, Bindestriche und Unterstriche enthalten. Labelschlüssel müssen mit einem Buchstaben oder einer Zahl beginnen.
Keine
Wartung
Wartungsfenster aktivieren
Legen Sie das Zeitfenster fest, in dem Cloud Data Fusion Wartungsvorgänge an der Instanz ausführen kann. Weitere Informationen finden Sie unter
Wartungsfenster konfigurieren.
Deaktiviert
Klicken Sie auf Erstellen. Es kann bis zu 30 Minuten dauern, bis die Instanz erstellt ist.
Während Cloud Data Fusion die Instanz erstellt, wird neben dem Instanznamen auf der Seite Instanzen ein Radsymbol angezeigt, das den Fortschritt angibt. Nachdem der Vorgang abgeschlossen ist, wird es zu einem grünen Häkchen. Dies zeigt an, dass Sie die Instanz verwenden können.
API
Instanz erstellen:
Wenn Sie eine Cloud Data Fusion-Instanz mit der Cloud Data Fusion REST API erstellen möchten, erstellen Sie eine instances.create API-Anfrage, indem Sie die Instance-Ressource mit Ihren Konfigurationsinformationen ausfüllen.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-04 (UTC)."],[[["\u003cp\u003eThis page details the process of creating a Cloud Data Fusion instance, covering prerequisites, console setup, and API methods.\u003c/p\u003e\n"],["\u003cp\u003eBefore creating an instance, users must enable the Cloud Data Fusion API and ensure they have the necessary \u003ccode\u003einstances.create\u003c/code\u003e permission.\u003c/p\u003e\n"],["\u003cp\u003eWhen creating an instance, users can specify various configurations, such as the instance name, region, version, edition, and advanced options like private IP and logging.\u003c/p\u003e\n"],["\u003cp\u003eInstance creation can be done via the Google Cloud console, navigating to the Cloud Data Fusion Instances page and selecting "Create an instance," or via a REST API request.\u003c/p\u003e\n"],["\u003cp\u003eAfter an instance is created, certain advanced options like Cloud Logging and Private IP cannot be added or removed and must be handled through an API \u003ccode\u003ePATCH\u003c/code\u003e method.\u003c/p\u003e\n"]]],[],null,["# Create a public instance\n\nThis page explains how to create a Cloud Data Fusion\n[instance](/data-fusion/docs/concepts/overview).\n\nBefore you begin\n----------------\n\n- [Enable the Cloud Data Fusion API](/data-fusion/docs/how-to/enable-service).\n- The following permission is required to create Cloud Data Fusion instances: `instances.create`. For more information, see [Access control](/data-fusion/docs/access-control).\n- Cloud Data Fusion instances run as the [Compute Engine\n default service account](/compute/docs/access/service-accounts#compute_engine_default_service_account). For information about the types and roles available, see [Service accounts](/iam/docs/service-account-types#google-managed_service_accounts).\n- By default, Cloud Data Fusion executes pipelines using a Dataproc cluster in your project. Ensure that your project meets the [Dataproc networking requirements](/dataproc/docs/concepts/configuring-clusters/network).\n- New projects start with a [default network](/vpc/docs/vpc#default-network). The default network is pre-populated with a firewall rule [default-allow-ssh](/vpc/docs/firewalls#more_rules_default_vpc), that allows incoming connections on TCP port 22 from any source to any instance in the network. In versions earlier than 6.2.0, if this rule to allow ingress on TCP port 22 doesn't exist in the network used by your Cloud Data Fusion instance, you must [create this rule](/vpc/docs/using-firewalls#creating_firewall_rules).\n\nCreate an instance\n------------------\n\n**Caution:** After you create a Cloud Data Fusion instance, you cannot change its edition. \n\n### Console\n\nIf the [API is enabled](/data-fusion/docs/how-to/enable-service), the\nCloud Data Fusion section in the Google Cloud console shows an\n**Instances** page, where you can create and manage your\nCloud Data Fusion instances.\n\n1. In the console, go to the Cloud Data Fusion page.\n2. Click **Instances** , and then click **Create an instance** .\n\n [Create an instance](https://console.cloud.google.com/data-fusion/instance-create)\n3. Enter an **Instance name**.\n4. Enter a **Description** for your instance.\n5. Specify the **Region** in which to create the instance.\n6. Specify the Cloud Data Fusion [**Version**](/data-fusion/docs/release-notes).\n7. Select an [**Edition**](/data-fusion/pricing). The default is **Basic**.\n8. Optional: Click **Add accelerators** to select accelerators to use in your instance.\n9. Specify the [**Dataproc service account**](/dataproc/docs/concepts/configuring-clusters/service-accounts) to use for running your Cloud Data Fusion pipeline in Dataproc. The default is the Compute Engine account. Regardless of version, make sure that a service account has appropriate Identity and Access Management roles for your needs. For more information, see [Granting service account user permission](/data-fusion/docs/how-to/granting-service-account-permission).\n10. Optional: Specify any advanced options. If you don't specify anything,\n the following defaults are used:\n\n11. Click **Create**. It takes up to 30 minutes for the instance\n creation process to complete.\n\nWhile Cloud Data Fusion creates your instance, a progress\nwheel displays next to the instance name on the **Instances** page. After\ncompletion, it turns into a green check mark and indicates that you can\nstart using the instance.\n| After you create an instance, you cannot add or remove the options for [Cloud Logging and Cloud Monitoring](/data-fusion/docs/how-to/viewing-stackdriver-logs#enabling-stackdriver) or [Private IP](/data-fusion/docs/how-to/create-private-ip). To update these options with the Cloud Data Fusion API, call the [`PATCH`](/data-fusion/docs/reference/rest/v1/projects.locations.instances/patch) method.\n\n### API\n\nCreate an instance:\n\nTo create a Cloud Data Fusion instance with the\n[Cloud Data Fusion REST API](/data-fusion/docs/reference/rest),\nconstruct an\n[`instances.create`](/data-fusion/docs/reference/rest/v1/projects.locations.instances/create)\nAPI request, filling in the\n[`Instance`](/data-fusion/docs/reference/rest/v1/projects.locations.instances#Instance)\nresource with your configuration information.\n\nWhat's next\n-----------\n\n- Learn more about [Cloud Data Fusion](/data-fusion/docs/concepts/overview).\n- Work through a [tutorial](/data-fusion/docs/tutorials/targeting-campaign-pipeline)."]]