Versionsupgrades für Instanzen und Pipelines verwalten

Auf dieser Seite wird beschrieben, wie Sie die Version Ihrer Instanzen oder Batchpipelines upgraden.

Führen Sie ein Upgrade Ihrer Cloud Data Fusion-Instanzen und Batchpipelines auf die neueste Plattform- und Plug-in-Version durch, um die neuesten Funktionen, Fehlerkorrekturen und Leistungsverbesserungen zu erhalten.

Hinweise

  • Planen Sie eine geplante Ausfallzeit für das Upgrade. Dieser Vorgang kann bis zu einer Stunde dauern.
  • Aktivieren Sie Cloud Shell in der Google Cloud Console.

    Cloud Shell aktivieren

Beschränkungen

  • Nachdem Sie eine Cloud Data Fusion-Instanz erstellt haben, können Sie ihre Edition nicht mehr ändern, auch nicht über einen Upgradevorgang.

  • Upgrades von Echtzeitpipelines werden nicht unterstützt, mit Ausnahme von Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden. Eine Behelfslösung finden Sie unter Upgrade von Echtzeitpipelines durchführen.

  • Cloud Data Fusion startet keine Pipelines neu, die infolge des Upgradevorgangs beendet wurden.

Cloud Data Fusion-Instanzen aktualisieren

Rufen Sie die Seite Instanzdetails auf, um eine Cloud Data Fusion-Instanz auf eine neue Cloud Data Fusion-Version zu aktualisieren:

  1. Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.

  2. Klicken Sie auf Instanzen und dann auf den Namen der Instanz, um die Seite Instanzdetails aufzurufen.

    Zur Seite „VM-Instanzen“

Führen Sie dann das Upgrade mithilfe der Google Cloud Console oder der gcloud CLI aus:

Console

  1. Klicken Sie auf Upgrade, um eine Liste der verfügbaren Versionen aufzurufen.

  2. Version auswählen

  3. Klicken Sie auf Upgrade.

  4. Prüfen Sie, ob das Upgrade erfolgreich war:

    1. Aktualisieren Sie die Seite Instanzdetails.

    2. Klicken Sie auf Instanz anzeigen, um in der Weboberfläche von Cloud Data Fusion auf die aktualisierte Instanz zuzugreifen.

    3. Klicken Sie in der Menüleiste auf Systemadmin.

      Die neue Versionsnummer wird oben auf der Seite angezeigt.

  5. Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.

gcloud

  1. Führen Sie den folgenden gcloud CLI-Befehl in einer lokalen Cloud Shell-Terminalsitzung aus, um ein Upgrade auf eine neue Cloud Data Fusion-Version durchzuführen:

      gcloud beta data-fusion instances update INSTANCE_ID \
        --project=PROJECT_ID \
        --location=LOCATION_NAME \
        --version=AVAILABLE_INSTANCE_VERSION
    
  2. So überprüfen Sie, ob das Upgrade erfolgreich war:

    1. Rufen Sie in der Google Cloud Console die Cloud Data Fusion-Seite Instanzen auf.

    2. Klicken Sie auf Instanz anzeigen, um in der Weboberfläche von Cloud Data Fusion auf die aktualisierte Instanz zuzugreifen.

    3. Klicken Sie in der Menüleiste auf System Admin.

      Die neue Versionsnummer wird oben auf der Seite angezeigt.

  3. Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.

Batch-Pipelines aktualisieren

So aktualisieren Sie Ihre Cloud Data Fusion-Batchpipelines auf die neuesten Plug-in-Versionen:

  1. Umgebungsvariablen festlegen

  2. Empfohlen: Sichern Sie alle Pipelines. Sie können Pipelines auf zwei Arten sichern:

    • Laden Sie die ZIP-Datei so herunter:

      1. Um einen Download der ZIP-Datei auszulösen, sichern Sie alle Pipelines mit dem folgenden Befehl:
      echo $CDAP_ENDPOINT/v3/export/apps
      
      1. Kopieren Sie die URL-Ausgabe in Ihren Browser.
      2. Extrahieren Sie die heruntergeladene Datei und prüfen Sie dann, ob alle Pipelines exportiert wurden. Die Pipelines sind nach Namespace organisiert.
    • Sie können Pipelines mit Source Control Management (SCM) sichern, das ab Version 6.9 verfügbar ist. SCM bietet GitHub-Integration, mit der Sie Pipelines sichern können.

  3. Führen Sie die folgenden Schritte aus, um Pipelines zu aktualisieren:

    1. Erstellen Sie eine Variable, die auf die Datei pipeline_upgrade.json verweist, die Sie im nächsten Schritt zum Speichern einer Liste von Pipelines erstellen.

      export PIPELINE_LIST=PATH/pipeline_upgrade.json
      

      Ersetzen Sie PATH durch den Pfad zur Datei.

    2. Erstellen Sie mit dem folgenden Befehl eine Liste aller Pipelines für eine Instanz und einen Namespace. Das Ergebnis wird in der Datei $PIPELINE_LIST im Format JSON gespeichert. Sie können die Liste bearbeiten, um Pipelines zu entfernen, die keine Upgrades benötigen.

      curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LIST
      

      Ersetzen Sie NAMESPACE_ID durch den Namespace, in dem das Upgrade ausgeführt werden soll.

    3. Upgrade für die in pipeline_upgrade.json aufgeführten Pipelines ausführen Fügen Sie die NAMESPACE_ID der Pipelines ein, die aktualisiert werden sollen. Der Befehl zeigt eine Liste der aktualisierten Pipelines mit dem Upgradestatus an.

      curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LIST
      

      Ersetzen Sie NAMESPACE_ID durch die Namespace-ID der Pipelines, die aktualisiert werden.

  4. Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.

Echtzeit-Pipelines upgraden

Upgrades von Echtzeitpipelines werden nicht unterstützt, mit Ausnahme von Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden.

Für alle anderen Schritte gehen Sie stattdessen so vor:

  1. Beenden und exportieren Sie die Pipelines.
  2. Führen Sie ein Upgrade der Instanz durch.
  3. Echtzeitpipelines in die aktualisierte Instanz importieren

Upgrade zur Aktivierung der Replikation

Die Replikation kann in Cloud Data Fusion-Umgebungen ab Version 6.3.0 aktiviert werden. Wenn Sie Version 6.2.3 verwenden, führen Sie ein Upgrade auf 6.3.0 und dann ein Upgrade auf die neueste Version durch. Anschließend können Sie die Replikation aktivieren.

Rollen für aktualisierte Instanzen zuweisen

Weisen Sie nach Abschluss des Upgrades dem Dataproc-Dienstkonto in Ihrem Projekt die Rolle „Cloud Data Fusion-Runner“ (roles/datafusion.runner) und die Rolle „Cloud Storage-Administrator“ (roles/storage.admin) zu.

Nächste Schritte