Dataproc Metastore aus einer Sicherung wiederherstellen

Auf dieser Seite wird erläutert, wie Sie einen Dataproc Metastore-Dienst aus einer Sicherung wiederherstellen.

Eine Sicherung ist ein Snapshot der Konfigurationseinstellungen und Metadaten, die in einem Dataproc Metastore-Dienst gespeichert sind. Mit der Wiederherstellungsfunktion können Sie schnell einen neuen Dataproc Metastore-Dienst mit den zuvor in einer Sicherung gespeicherten Daten einrichten.

Hinweise

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren, damit Sie die Berechtigungen erhalten, die Sie zum Wiederherstellen eines Dataproc Metastore-Dienstes aus einer Sicherung benötigen:

  • Wenn Sie die vollständige Kontrolle über Dataproc Metastore-Ressourcen zum Ausführen einer Sicherung gewähren möchten, haben Sie folgende Möglichkeiten:
  • So verwenden Sie das Cloud Storage-Objekt, das geplante Sicherungen speichert: Cloud Storage-Objektnutzer (roles/storage.objectUser) im Dataproc Metastore-Dienst-Agent

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Wiederherstellen eines Dataproc Metastore-Dienstes aus einer Sicherung erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um einen Dataproc Metastore-Dienst aus einer Sicherung wiederherzustellen:

  • So stellen Sie einen Metadatendienst wieder her: metastore.services.restore, metastore.backups.use
  • So verwenden Sie das Cloud Storage-Objekt:
    • orgpolicy.policy.get
    • resourcemanager.projects.get
    • resourcemanager.projects.list
    • storage.managedFolders.create
    • storage.managedFolders.delete
    • storage.managedFolders.get
    • storage.managedFolders.list
    • storage.multipartUploads.*
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.restore
    • storage.objects.update

Möglicherweise können Sie diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Weitere Informationen zu bestimmten Dataproc Metastore-Rollen und -Berechtigungen finden Sie in der Übersicht zu Dataproc Metastore IAM.

Wiederherstellung aus einer Sicherung

Wenn Sie einen Dienst aus einer Sicherung wiederherstellen, können Sie eine der folgenden Optionen auswählen:

  • Stellen Sie alle Metadaten und die in der Sicherung gespeicherten Konfigurationseinstellungen wieder her.
  • Alle Metadaten wiederherstellen, aber nicht die in der Sicherung gespeicherten Konfigurationseinstellungen. Stattdessen behält der Dienst Ihre aktuellen Konfigurationseinstellungen bei.

    Zu den Konfigurationseinstellungen gehören Dataproc Metastore-Parameter wie Dienstname, Portnummer und Netzwerkeinstellungen. Metadaten umfassen alle Datenbank- und Tabelleninformationen, die in einem Dataproc Metastore-Dienst gespeichert sind.

Hinweise

  • Während ein Wiederherstellungsvorgang ausgeführt wird, können Sie Ihren Dienst nicht aktualisieren, beispielsweise keine Konfigurationseinstellungen ändern. Sie können Ihren Dienst jedoch weiterhin für normale Vorgänge verwenden, z. B. für den Zugriff auf seine Metadaten über angehängte Dataproc- oder selbstverwaltete Cluster.

  • Dataproc Metastore-Labels werden nicht wiederhergestellt.

  • Im Warehouse-Verzeichnis gespeicherte Daten werden nicht wiederhergestellt.

  • Bei der Wiederherstellung aus einer Sicherung werden detaillierte IAM-Richtlinien nicht wiederhergestellt oder ersetzt.

  • Für die Wiederherstellung aus einer geplanten Sicherung muss sich die Sicherung in einem Cloud Storage-Bucket befinden.

Aus einer Sicherung wiederherstellen

Führen Sie die folgenden Schritte aus, um einen Dataproc Metastore-Dienst aus einer Sicherung wiederherzustellen.

  • Wenn Sie die Google Cloud Console verwenden, können Sie Metadaten nur aus einer Sicherung wiederherstellen, die im selben Projekt und in derselben Region wie der neue Dienst erstellt wurde.

  • Wenn Sie die Google Cloud CLI oder Dataproc Metastore APIs verwenden, können Sie Metadaten aus einer Sicherung wiederherstellen, die in einem anderen Projekt und einer anderen Region erstellt wurde (dienstübergreifende Sicherung).

Console

  1. Öffnen Sie in der Google Cloud Console die Seite Dataproc Metastore:

    Dataproc Metastore öffnen

  2. Klicken Sie auf der Seite Dataproc Metastore auf den Namen des Dienstes, den Sie aus einer Sicherung wiederherstellen möchten.

    Die Seite Dienstdetails wird geöffnet.

    Seite „Dienstdetails“
    Abbildung 1. Detailseite des Dataproc Metastore-Dienstes
  3. Klicken Sie auf den Tab Backup/Wiederherstellung, um Ihre Sicherungen anzusehen.

  4. Wählen Sie die gewünschte Sicherung aus. Klicken Sie dazu auf das Dreistrich-Menü und wählen Sie Wiederherstellen aus.

    Die Seite Wiederherstellen wird geöffnet.

    Sie können den Dienst auch auf der Seite Sicherungsdetails wiederherstellen. Klicken Sie dazu auf den Namen der Sicherung und dann auf Wiederherstellen.

  5. Wählen Sie den entsprechenden Wiederherstellungsvorgang aus:

    • Metastore-Daten wiederherstellen Es werden alle Metadaten wiederhergestellt, aber nicht die in der Sicherung gespeicherten Konfigurationseinstellungen.
    • Metastore-Daten und Dienstkonfiguration wiederherstellen Es werden alle Metadaten und alle in der Sicherung gespeicherten Konfigurationseinstellungen wiederhergestellt.
  6. Klicken Sie auf Wiederherstellen, um den Dienst zu aktualisieren.

    Kehren Sie zur Seite Dataproc Metastore zurück und prüfen Sie, ob Ihr Dienst erfolgreich gesichert wurde.

    Nach Abschluss der Wiederherstellung kehrt Dataproc Metastore automatisch in den aktiven Status zurück, unabhängig davon, ob die Wiederherstellung erfolgreich war oder nicht.

gcloud-CLI

  1. Führen Sie den folgenden gcloud metastore services restore-Befehl aus, um einen Dataproc Metastore-Dienst wiederherzustellen:

    gcloud metastore services restore SERVICE  \
        --project=PROJECT_ID \
        --location=LOCATION \
        --backup=BACKUP \
        --restore-type=RESTORE_TYPE \
        --backup-location=BACKUP_LOCATION
    

    Ersetzen Sie Folgendes:

    • SERVICE: der Name Ihres Dataproc Metastore-Dienstes.
    • PROJECT_ID: die Projekt-ID des Google Cloud-Projekts, in dem sich der Dataproc Metastoreservice befindet.
    • LOCATION: Die Google Cloud-Region, in der sich der Dataproc Metastore-Dienst befindet.
    • BACKUP (optional): Die ID der Sicherungsdatei, aus der Sie wiederherstellen. Dieser Wert kann die Sicherungs-ID, eine vollständig qualifizierte URL oder der relative Name im folgenden Format sein: projects/{project_id}/locations/{location_id}/services/{service_id}/backups/{backup_id}.
    • RESTORE_TYPE: Der Typ des auszuführenden Wiederherstellungsvorgangs. Zulässige Werte sind „metadata-only“ und „full“. Der Standardwert ist metadata-only.
    • BACKUP_LOCATION (optional): Der Cloud Storage-Speicherort der geplanten Sicherung. Beispiel: gs://my-bucket/path/to/location
  2. Prüfen Sie, ob die Wiederherstellung erfolgreich war.

    Nach Abschluss der Wiederherstellung kehrt Dataproc Metastore automatisch in den aktiven Status zurück, unabhängig davon, ob die Wiederherstellung erfolgreich war oder nicht.

REST

Folgen Sie der API-Anleitung zur Wiederherstellung von Metadaten in einem Dienst mithilfe von APIs Explorer.

Nach Abschluss der Wiederherstellung kehrt Dataproc Metastore automatisch in den aktiven Status zurück, unabhängig davon, ob die Wiederherstellung erfolgreich war.

Wiederherstellungsverlauf ansehen

Führen Sie die folgenden Schritte aus, um den Wiederherstellungsverlauf eines Dataproc Metastore-Dienstes in der Google Cloud Console aufzurufen:

  1. Öffnen Sie in der Google Cloud Console die Seite Dataproc Metastore.
  2. Klicken Sie in der Navigationsleiste auf Backup/Restore (Sicherung/Wiederherstellung).

    Der Wiederherstellungsverlauf wird in einer Tabelle unter Wiederherstellen angezeigt.

    Im Verlauf werden maximal die 25 letzten Wiederherstellungen angezeigt, die Sie abgeschlossen haben.

    Durch das Löschen eines Dataproc Metastore-Dienstes wird auch der gesamte zugehörige Wiederherstellungsverlauf gelöscht.

Häufige Probleme beheben

Nächste Schritte