Datenbanktypen

Wenn Sie einen Dataproc Metastore-Dienst erstellen, müssen Sie entweder den MySQL- oder den Spanner-Datenbanktyp auswählen.

Diese Wahl wirkt sich auf die Funktionen aus, die Sie in Ihren Dataproc Metastore-Dienst einbinden und verwenden können. Hinweis: Sie können den Datenbanktyp nicht mehr aktualisieren, nachdem Sie einen Dataproc Metastore-Dienst erstellt haben. Achten Sie darauf, den für Ihre Anforderungen geeigneten Datenbanktyp auszuwählen.

Auf dieser Seite werden die Unterschiede zwischen diesen Datenbanktypen erläutert und Sie erfahren, wie Sie einen für Ihren Dienst auswählen.

Unterschiede zwischen MySQL und Spanner

MySQL

Der MySQL-Datenbanktyp von Dataproc Metastore ist eine Implementierung von Cloud SQL. Beachten Sie bei der Verwendung einer MySQL-Datenbank Folgendes:

  • MySQL ist der Standarddatenbanktyp beim Erstellen eines Dataproc-Metastores.
  • MySQL wird von allen Hive-Versionen unterstützt.
  • MySQL unterstützt alle Dataproc Metastore-Funktionen.
  • MySQL unterstützt die Verschlüsselung von Dataproc Metastore, z. B. mit vom Kunden verwalteten Verschlüsselungsschlüsseln (Customer-Managed Encryption Keys, CMEK).

Spanner

Der Dataproc Metastore-Spanner-Datenbanktyp ist eine Implementierung von Spanner. Beachten Sie bei der Verwendung einer Spanner-Datenbank Folgendes:

  • Spanner wird nur von den Hive-Versionen 2.3.6 und 3.1.2 unterstützt.
  • Spanner unterstützt nur Avro-Importe.

Weitere Informationen

In der folgenden Tabelle finden Sie weitere Informationen zu diesen Unterschieden.

MySQL Spanner
Zuverlässigkeit (Verfügbarkeit) Cloud SQL-SLA: 99,95%* Spanner-SLO: 99,99%*
Wartungsfenster Erforderlich Nicht erforderlich

Hinweise:

  • * Die Cloud SQL- und Spanner-SLAs können nicht direkt in Dataproc Metastore-SLAs umgewandelt werden. Dataproc Metastore Die Auswahl des Datenbanktyps hat keine Auswirkungen auf die SLOs von Dataproc Metastore.
  • Die Preise für die beiden Datenbanktypen unterscheiden sich nicht.

Hinweise

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen eines Dataproc-Metastores benötigen. Dabei wird das Prinzip der geringsten Berechtigung angewendet:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigung metastore.services.create, die zum Erstellen eines Dataproc-Metastores erforderlich ist.

Sie können diese Berechtigung auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Weitere Informationen zu bestimmten Dataproc Metastore-Rollen und ‑Berechtigungen finden Sie unter Dataproc-Zugriff mit IAM verwalten.

Datenbanktyp auswählen

Sie wählen den Datenbanktyp aus, wenn Sie einen Dataproc Metastore-Dienst zum ersten Mal erstellen.

Das folgende Beispiel zeigt eine gekürzte Version der Schritte, die Sie ausführen, um einen Datenbanktyp auszuwählen. Eine detaillierte Anleitung finden Sie unter Dataproc Metastore-Dienst erstellen.

Console

  1. Öffnen Sie in der Google Cloud Console die Seite „Dataproc Metastore“:

    Dataproc Metastore öffnen

  2. Klicken Sie in der Navigationsleiste auf Erstellen.

    Die Seite Dienst erstellen wird geöffnet.

  3. Wählen Sie unter Datenbanktyp entweder MySQL oder Spanner aus.

    MySQL ist der Standarddatenbanktyp.

  4. Wählen Sie nach Bedarf die übrigen Konfigurationen für Ihren Dienst aus.

  5. Klicken Sie auf Senden.

gcloud-CLI

  1. Führen Sie dazu den Befehl gcloud metastore services create aus.

    gcloud metastore services create SERVICE_ID \
       --location=LOCATION \
       --database-type=DATABASE_TYPE; default="mysql"
    

    Ersetzen Sie Folgendes:

    • SERVICE_ID: der Name oder die ID Ihres Dataproc Metastore-Dienstes.
    • LOCATION: die Region, in der sich Ihr Dataproc Metastore-Dienst befindet.
    • DATABASE_TYPE: Der Datenbanktyp, den Sie für Ihren Dataproc Metastore-Dienst festlegen möchten. Zulässige Werte: mysql und spanner. Der Standardwert ist mysql.

Nächste Schritte