Cluster wiederverwenden

Auf dieser Seite wird beschrieben, wie Sie Dataproc-Cluster für Ihre Pipelineausführungen in Cloud Data Fusion wiederverwenden. Weitere Informationen finden Sie unter Cluster wiederverwenden und Pipeline für einen vorhandenen Dataproc-Cluster ausführen.

Hinweis

  • Sie benötigen eine Cloud Data Fusion-Instanz in Version 6.5.0 oder höher.

Wiederverwendung von Clustern aktivieren

Sie können Cluster in einem neuen Compute-Profil oder in einem Profil wiederverwenden, das in einer bereitgestellten Pipeline verwendet wurde.

Wiederverwendung von Clustern in einem neuen Profil aktivieren

  1. Rufen Sie Ihre Instanz auf:

    1. Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.

    2. Wenn Sie die Instanz in Cloud Data Fusion Studio öffnen möchten, klicken Sie auf Instanzen und dann auf Instanz anzeigen.

      Zur Seite „VM-Instanzen“

  2. Klicken Sie auf Systemadministrator > Konfiguration > Systemcomputeprofile.

  3. Klicken Sie auf Neues Profil erstellen.

  4. Wählen Sie den Dataproc-Bereitsteller aus.

  5. Geben Sie im Fenster Profil für Dataproc erstellen die Details zu Ihrem Cluster ein:

    1. Geben Sie in den Feldern Profillabel und Profilname einen Namen ein, um das Profil zu identifizieren, z. B. execution_compute-profile.
    2. Geben Sie im Feld Beschreibung den Zweck des Profils an, z. B. Profile used for pipeline execution.
    3. Geben Sie im Feld Maximale Inaktivitätszeit einen Wert ein. Weitere Informationen finden Sie unter Maximale Inaktivitätszeit festlegen.
    4. Legen Sie für das Feld Clusterlöschung überspringen den Wert True fest. Weitere Informationen finden Sie unter Cluster wiederverwenden.
    5. Optional: Konfigurieren Sie andere optionale Felder.
    6. Klicken Sie auf Erstellen.

Wiederverwendung von Clustern in einer bereitgestellten Pipeline aktivieren

  1. Rufen Sie Ihre Instanz auf:

    1. Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.

    2. Wenn Sie die Instanz in Cloud Data Fusion Studio öffnen möchten, klicken Sie auf Instanzen und dann auf Instanz anzeigen.

      Zur Seite „VM-Instanzen“

  2. Klicken Sie auf Liste.

  3. Klicken Sie auf den Tab Bereitgestellt und dann auf einen Pipelinenamen. Die bereitgestellte Pipeline wird auf der Seite Studio in der Cloud Data Fusion-Weboberfläche geöffnet.

  4. Klicken Sie auf Konfigurieren.

  5. Gehen Sie im Fenster Compute-Konfiguration zum ausgewählten Profil und klicken Sie auf Anpassen.

  6. Geben Sie im angezeigten Fenster die folgenden Werte ein:

    1. Geben Sie im Feld Max. Inaktivitätszeit einen Wert ein. Weitere Informationen finden Sie unter Maximale Inaktivitätszeit festlegen.
    2. Legen Sie für Clusterlöschung überspringen den Wert True fest. Weitere Informationen finden Sie unter Cluster wiederverwenden.
  7. Klicken Sie auf Fertig.

Nächste Schritte