Auf dieser Seite wird beschrieben, wie Sie die Version Ihrer Instanzen oder Batchpipelines aktualisieren.
Aktualisieren Sie Ihre Cloud Data Fusion-Instanzen und ‑Batchpipelines auf die neuesten Plattform- und Plug-in-Versionen, um die neuesten Funktionen, Fehlerkorrekturen und Leistungsverbesserungen zu erhalten.
Hinweise
- Planen Sie eine geplante Ausfallzeit für das Upgrade. Der Vorgang dauert bis zu einer Stunde.
-
In the Google Cloud console, activate Cloud Shell.
Beschränkungen
Nachdem Sie eine Cloud Data Fusion-Instanz erstellt haben, können Sie ihre Edition nicht mehr ändern, auch nicht durch ein Upgrade.
Lösen Sie kein Upgrade mit Terraform aus, da die Instanz dadurch gelöscht und neu erstellt wird, anstatt ein direktes Upgrade durchzuführen. Dieses Problem führt zum Verlust aller vorhandenen Daten in der Instanz.
Cloud Data Fusion startet Pipelines, die aufgrund des Upgradevorgangs beendet werden, nicht neu.
Wenn Sie ein Upgrade einer Instanz von Versionen vor 6.11.0 durchführen, müssen Sie mit längeren Ausfallzeiten rechnen, insbesondere wenn die Instanz viele Daten verarbeitet.
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, außer bei Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden. Eine Problemumgehung finden Sie unter Echtzeit-Pipelines aktualisieren.
Cloud Data Fusion-Instanzen aktualisieren
So aktualisieren Sie eine Cloud Data Fusion-Instanz auf eine neue Cloud Data Fusion-Version: Rufen Sie die Seite Instanzdetails auf:
Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.
Klicken Sie auf Instanzen und dann auf den Namen der Instanz, um die Seite Instanzdetails aufzurufen.
Führen Sie dann das Upgrade mithilfe der Google Cloud Console oder der gcloud CLI durch:
Konsole
Klicken Sie auf Upgrade, um eine Liste der verfügbaren Versionen aufzurufen.
Version auswählen
Klicken Sie auf Upgrade.
Prüfen Sie, ob das Upgrade erfolgreich war:
Aktualisieren Sie die Seite Instanzdetails.
Klicken Sie auf Instanz aufrufen, um in der Cloud Data Fusion-Weboberfläche auf die aktualisierte Instanz zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
gcloud
Führen Sie in einer lokalen Cloud Shell-Sitzung den folgenden gcloud CLI-Befehl aus, um ein Upgrade auf eine neue Cloud Data Fusion-Version durchzuführen:
gcloud beta data-fusion instances update INSTANCE_ID \ --project=PROJECT_ID \ --location=LOCATION_NAME \ --version=AVAILABLE_INSTANCE_VERSION
Optional: Fügen Sie die Flags
--enable_stackdriver_logging
,--enable_stackdriver_monitoring
und--labels
hinzu, sofern sie für Ihre Instanz zutreffen.Optional: Sie können die CDAP-Attribute, z. B.
enable.unrecoverable.reset
, als--options
übergeben.
So prüfen Sie, ob das Upgrade erfolgreich war:
Rufen Sie in der Google Cloud Console die Seite Cloud Data Fusion-Instanzen auf.
Klicken Sie auf Instanz aufrufen, um in der Cloud Data Fusion-Weboberfläche auf die aktualisierte Instanz zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
Batch-Pipelines aktualisieren
So aktualisieren Sie Ihre Cloud Data Fusion-Batchpipelines auf die neuesten Plug-in-Versionen:
Empfohlen:Sichern Sie alle Pipelines. Sie haben zwei Möglichkeiten, Pipelines zu sichern:
So laden Sie die ZIP-Datei herunter:
- Sichern Sie alle Pipelines mit dem folgenden Befehl, um einen ZIP-Datei-Download auszulösen:
echo $CDAP_ENDPOINT/v3/export/apps
- Kopieren Sie die URL-Ausgabe in Ihren Browser.
- Entpacken Sie die heruntergeladene Datei und prüfen Sie, ob alle Pipelines exportiert wurden. Die Pipelines sind nach Namespace organisiert.
Sichern Sie Pipelines mit Source Control Management (SCM), das ab Version 6.9 verfügbar ist. SCM bietet eine GitHub-Integration, mit der Sie Pipelines sichern können.
So aktualisieren Sie Pipelines:
Erstellen Sie eine Variable, die auf die Datei
pipeline_upgrade.json
verweist. Diese Datei erstellen Sie im nächsten Schritt, um eine Liste von Pipelines zu speichern.export PIPELINE_LIST=PATH/pipeline_upgrade.json
Ersetzen Sie PATH durch den Pfad zur Datei.
Erstellen Sie mit dem folgenden Befehl eine Liste aller Pipelines für eine Instanz und einen Namespace. Das Ergebnis wird in der Datei
$PIPELINE_LIST
im FormatJSON
gespeichert. Sie können die Liste bearbeiten, um Pipelines zu entfernen, die nicht aktualisiert werden müssen.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LIST
Ersetzen Sie NAMESPACE_ID durch den Namespace, in dem das Upgrade ausgeführt werden soll.
Upgrade für die in
pipeline_upgrade.json
aufgeführten Pipelines ausführen Fügen Sie die NAMESPACE_ID der Pipelines ein, die aktualisiert werden sollen. Der Befehl zeigt eine Liste der aktualisierten Pipelines mit dem Upgradestatus an.curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LIST
Ersetzen Sie NAMESPACE_ID durch die Namespace-ID der Pipelines, die aktualisiert werden.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
Echtzeit-Pipelines aktualisieren
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, mit Ausnahme von Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden.
Für alles andere gehen Sie stattdessen so vor:
- Beenden Sie die Pipelines und exportieren Sie sie.
- Führen Sie ein Upgrade der Instanz durch.
- Importieren Sie die Echtzeit-Pipelines in Ihre aktualisierte Instanz.
Upgrade zur Aktivierung der Replikation
Die Replikation kann in Cloud Data Fusion-Umgebungen ab Version 6.3.0 aktiviert werden. Wenn Sie Version 6.2.3 haben, führen Sie ein Upgrade auf Version 6.3.0 und dann auf die aktuelle Version durch. Anschließend können Sie die Replikation aktivieren.
Rollen für aktualisierte Instanzen zuweisen
Weisen Sie nach Abschluss des Upgrades dem Dataproc-Dienstkonto in Ihrem Projekt die Rolle „Cloud Data Fusion-Runner“ (roles/datafusion.runner
) und die Rolle „Cloud Storage-Administrator“ (roles/storage.admin
) zu.
Nächste Schritte
- Patchversionen für Cloud Data Fusion-Instanzen verwalten.
- Informationen zur Versionsverwaltung in Cloud Data Fusion
- Weitere Informationen finden Sie unter Verfügbare Versionen und Patch-Versions-Upgrades.
- Fehlerbehebung bei Upgrades