Auf dieser Seite wird beschrieben, wie Sie die Version Ihrer Instanzen oder Batch-Pipelines aktualisieren.
Aktualisieren Sie Ihre Cloud Data Fusion-Instanzen und -Batchpipelines auf die neuesten Plattform- und Plug-in-Versionen, um die neuesten Funktionen, Fehlerkorrekturen und Leistungsverbesserungen zu erhalten.
Hinweis
- Planen Sie eine geplante Ausfallzeit für das Upgrade. Der Vorgang dauert bis zu einer Stunde.
-
In the Google Cloud console, activate Cloud Shell.
Beschränkungen
Nachdem Sie eine Cloud Data Fusion-Instanz erstellt haben, können Sie die Version nicht mehr ändern, auch nicht durch ein Upgrade.
Lösen Sie kein Upgrade mit Terraform aus, da die Instanz gelöscht und neu erstellt wird, anstatt ein direktes Upgrade durchzuführen. Dadurch gehen alle vorhandenen Daten in der Instanz verloren.
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, mit Ausnahme von Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden. Eine Problemumgehung finden Sie unter Echtzeit-Pipelines aktualisieren.
Pipelines, die aufgrund des Upgrades gestoppt werden, werden in Cloud Data Fusion nicht neu gestartet.
Cloud Data Fusion-Instanzen aktualisieren
Wenn Sie eine Cloud Data Fusion-Instanz auf eine neue Cloud Data Fusion-Version aktualisieren möchten, rufen Sie die Seite Instanzdetails auf:
Rufen Sie in der Google Cloud Console die Seite „Cloud Data Fusion“ auf.
Klicken Sie auf Instanzen und dann auf den Namen der Instanz, um die Seite Instanzdetails aufzurufen.
Führen Sie dann das Upgrade mithilfe der Google Cloud Console oder der gcloud CLI durch:
Console
Klicken Sie auf Upgrade, um eine Liste der verfügbaren Versionen aufzurufen.
Version auswählen
Klicken Sie auf Upgrade.
Prüfen Sie, ob das Upgrade erfolgreich war:
Aktualisieren Sie die Seite Instanzdetails.
Klicken Sie auf Instanz aufrufen, um in der Cloud Data Fusion-Weboberfläche auf die aktualisierte Instanz zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
gcloud
Führen Sie in einer lokalen Cloud Shell-Sitzung den folgenden gcloud-Befehl aus, um ein Upgrade auf eine neue Cloud Data Fusion-Version durchzuführen:
gcloud beta data-fusion instances update INSTANCE_ID \ --project=PROJECT_ID \ --location=LOCATION_NAME \ --version=AVAILABLE_INSTANCE_VERSION
Optional: Fügen Sie gegebenenfalls die Flags
--enable_stackdriver_logging
,--enable_stackdriver_monitoring
und--labels
hinzu.Optional: Sie können die CDAP-Attribute wie
enable.unrecoverable.reset
als--options
übergeben.
So prüfen Sie, ob das Upgrade erfolgreich war:
Rufen Sie in der Google Cloud Console die Seite Cloud Data Fusion-Instanzen auf.
Klicken Sie auf Instanz aufrufen, um in der Cloud Data Fusion-Weboberfläche auf die aktualisierte Instanz zuzugreifen.
Klicken Sie in der Menüleiste auf Systemadministrator.
Die neue Versionsnummer wird oben auf der Seite angezeigt.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
Batch-Pipelines aktualisieren
So aktualisieren Sie Ihre Cloud Data Fusion-Batchpipelines auf die neuesten Plug-in-Versionen:
Empfohlen:Sichern Sie alle Pipelines. Sie haben zwei Möglichkeiten, Pipelines zu sichern:
So laden Sie die ZIP-Datei herunter:
- Wenn Sie einen Download einer ZIP-Datei auslösen möchten, sichern Sie alle Pipelines mit dem folgenden Befehl:
echo $CDAP_ENDPOINT/v3/export/apps
- Kopieren Sie die URL-Ausgabe in Ihren Browser.
- Entpacken Sie die heruntergeladene Datei und prüfen Sie, ob alle Pipelines exportiert wurden. Die Pipelines sind nach Namespace organisiert.
Pipelines mithilfe der Quellcodeverwaltung (SCM) sichern, verfügbar ab Version 6.9 SCM bietet eine GitHub-Integration, mit der Sie Pipelines sichern können.
So aktualisieren Sie Pipelines:
Erstellen Sie eine Variable, die auf die Datei
pipeline_upgrade.json
verweist. Diese Datei erstellen Sie im nächsten Schritt, um eine Liste von Pipelines zu speichern.export PIPELINE_LIST=PATH/pipeline_upgrade.json
Ersetzen Sie PATH durch den Pfad zur Datei.
Erstellen Sie mit dem folgenden Befehl eine Liste aller Pipelines für eine Instanz und einen Namespace. Das Ergebnis wird in der Datei
$PIPELINE_LIST
im FormatJSON
gespeichert. Sie können die Liste bearbeiten, um Pipelines zu entfernen, die nicht aktualisiert werden müssen.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LIST
Ersetzen Sie NAMESPACE_ID durch den Namespace, in dem das Upgrade ausgeführt werden soll.
Upgrade für die in
pipeline_upgrade.json
aufgeführten Pipelines ausführen Fügen Sie die NAMESPACE_ID der Pipelines ein, die aktualisiert werden sollen. Der Befehl zeigt eine Liste der aktualisierten Pipelines mit dem Upgradestatus an.curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LIST
Ersetzen Sie NAMESPACE_ID durch die Namespace-ID der Pipelines, die aktualisiert werden.
Damit Ihre Pipelines nicht hängen bleiben, wenn Sie sie in der neuen Version ausführen, weisen Sie die erforderlichen Rollen in der aktualisierten Instanz zu.
Echtzeit-Pipelines aktualisieren
Das Upgrade von Echtzeit-Pipelines wird nicht unterstützt, mit Ausnahme von Pipelines, die in Version 6.8.0 mit einer Kafka-Echtzeitquelle erstellt wurden.
In allen anderen Fällen gehen Sie so vor:
- Beenden und exportieren Sie die Pipelines.
- Führen Sie ein Upgrade der Instanz aus.
- Importieren Sie die Echtzeit-Pipelines in die aktualisierte Instanz.
Upgrade zur Aktivierung der Replikation
Die Replikation kann in Cloud Data Fusion-Umgebungen ab Version 6.3.0 aktiviert werden. Wenn Sie Version 6.2.3 haben, führen Sie ein Upgrade auf Version 6.3.0 und dann auf die neueste Version durch. Sie können dann die Replikation aktivieren.
Rollen für aktualisierte Instanzen zuweisen
Weisen Sie nach Abschluss des Upgrades dem Dataproc-Dienstkonto in Ihrem Projekt die Rolle Cloud Data Fusion-Runner (roles/datafusion.runner
) und die Rolle Cloud Storage-Administrator (roles/storage.admin
) zu.
Nächste Schritte
- Patchversionen für Cloud Data Fusion-Instanzen verwalten
- Weitere Informationen zur Versionierung in Cloud Data Fusion
- Weitere Informationen finden Sie unter Verfügbare Upgrades für Versionen und Patch-Überarbeitungen.
- Fehlerbehebung bei Upgrades