Aus einer PostgreSQL-Datenbank lesen

Auf dieser Seite wird beschrieben, wie Sie Daten aus einer PostgreSQL-Datenbank in einer Cloud Data Fusion-Instanz lesen.

Hinweis

  • Erstellen Sie eine Cloud Data Fusion-Instanz.
  • Aktivieren Sie Ihre PostgreSQL-Datenbank, um Verbindungen von Cloud Data Fusion zu akzeptieren. Für eine sichere Nutzung der Instanz empfehlen wir die Verwendung einer privaten Cloud Data Fusion-Instanz.

Instanz in Cloud Data Fusion öffnen

  1. Rufen Sie in der Google Cloud Console die Seite Cloud Data Fusion-Instanzen auf.

    Zur Seite „VM-Instanzen“

    Auf dieser Seite können Sie Ihre Instanzen verwalten.

  2. Klicken Sie auf Instanz ansehen, um Ihre Instanz in der Cloud Data Fusion-UI zu öffnen.

Speichern Sie Ihr PostgreSQL-Passwort als Sicherheitsschlüssel

Geben Sie das PostgreSQL-Passwort als sicheren Schlüssel ein, der in der Cloud Data Fusion-Instanz verschlüsselt werden soll. Weitere Informationen zu Schlüsseln finden Sie unter Cloud KMS.

  1. Klicken Sie in der Cloud Data Fusion-UI auf Systemadministrator > Konfiguration.

  2. Klicken Sie auf HTTP-Aufrufe.

    Configuration um.

  3. Wählen Sie im Drop-down-Menü PUT aus.

  4. Geben Sie im Feld Pfad namespaces/default/securekeys/pg_password ein.

  5. Geben Sie im Feld Body den Wert {"data":"POSTGRESQL_PASSWORD"} ein. Ersetzen Sie POSTGRESQL_PASSWORD durch Ihr PostgreSQL-Passwort.

  6. Klicken Sie auf Senden.

    Passwort

Im Feld Antwort werden Sie über Fehler informiert.

Mit Cloud SQL for PostgreSQL verbinden

  1. Klicken Sie in der Cloud Data Fusion-UI auf das Menü und rufen Sie die Seite Wrangler auf.

  2. Klicken Sie auf Verbindung hinzufügen.

  3. Wählen Sie als Verbindungstyp Datenbank aus.

    Verbindung hinzufügen

  4. Klicken Sie unter Google Cloud SQL for PostgreSQL auf Hochladen.

    Quelle auswählen.

  5. Laden Sie eine JAR-Datei hoch, die Ihren PostgreSQL-Treiber enthält. Ihre JAR-Datei muss das Format NAME-VERSION.jar haben. Wenn Ihre JAR-Datei dieses Format nicht befolgt, benennen Sie sie vor dem Hochladen um.

  6. Klicken Sie auf Next (Weiter).

  7. Geben Sie den Namen, die Klasse und die Version des Treibers in die Felder ein.

  8. Klicken Sie auf Finish (Beenden).

  9. Klicken Sie im Fenster Verbindung hinzufügen auf Google Cloud SQL for PostgreSQL. Der JAR-Name sollte unter Google Cloud SQL for PostgreSQL angezeigt werden.

    JAR-Datei hochgeladen.

  10. Füllen Sie die Pflichtfelder aus. Wählen Sie im Feld Passwort den zuvor gespeicherten Schlüssel aus. Dadurch wird Ihr Passwort mit Cloud KMS abgerufen.

    Passwort auswählen

  11. Geben Sie in das Feld Verbindungsstring den folgenden String ein:

    jdbc:postgresql://google/DATABASE_NAME?cloudSqlInstance=INSTANCE_CONNECTION_NAME&socketFactory=com.google.cloud.sql.postgres.SocketFactory&useSSL=false
    

    Ersetzen Sie Folgendes:

    • DATABASE_NAME: Der Cloud SQL-Datenbankname, der auf der Seite „Instanzdetails“ auf dem Tab Datenbanken aufgeführt ist.
    • INSTANCE_CONNECTION_NAME: Der Name der Cloud SQL-Instanzverbindung, der auf der Seite „Instanzdetails“ auf dem Tab Übersicht angezeigt wird.
    Name der Instanzverbindung.

    Beispiel:

    jdbc:postgresql://google/postgres?cloudSqlInstance=dis-demo:us-central1:pgsql-1&socketFactory=com.google.cloud.sql.postgres.SocketFactory&useSSL=false
    

  12. Cloud SQL Admin API aktivieren.

  13. Weisen Sie dem Dienstkonto „service-PROJECT_NUMBER@gcp-sa-datafusion.iam.gserviceaccount.com“ die folgenden IAM-Rollen zu:

    Weitere Informationen zum Gewähren von Rollen finden Sie unter Zugriff verwalten.

  14. Klicken Sie auf Verbindung testen, um sicherzustellen, dass die Verbindung mit der Datenbank hergestellt werden kann.

  15. Klicken Sie auf Verbindung hinzufügen.

Nachdem die PostgreSQL-Datenbank verbunden wurde, können Sie in Wrangler Transformationen auf Ihre Daten anwenden und in Studio eine Pipeline erstellen sowie die Ausgabe in eine Senke schreiben.