Aus einer SQL Server-Tabelle lesen


Auf dieser Seite wird beschrieben, wie Sie Ihre Datenpipeline einrichten, um Daten aus einer Microsoft SQL Server-Tabelle zu lesen.

Hinweise

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. Enable the Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc APIs.

    Enable the APIs

  7. Erstellen Sie eine Cloud Data Fusion-Instanz.
  8. Ihre SQL Server-Datenbank muss Verbindungen von Cloud Data Fusion akzeptieren. Verwenden Sie aus Sicherheitsgründen eine private Cloud Data Fusion-Instanz.

Cloud Data Fusion-Instanz öffnen

  1. Rufen Sie in der Google Cloud Console die Cloud Data Fusion-Seite Instanzen auf.

    Zur Seite „VM-Instanzen“

  2. Klicken Sie in der Spalte Aktionen für die Instanz auf Instanz anzeigen, um die Instanz in Cloud Data Fusion zu öffnen.

SQL Server-Passwort als sicheren Schlüssel speichern

Fügen Sie Ihr SQL Server-Passwort als sicheren Schlüssel in Ihrer Cloud Data Fusion-Instanz hinzu.

  1. Klicken Sie in Cloud Data Fusion auf System Admin (Systemadministrator).

  2. Klicken Sie auf den Tab Konfiguration.

  3. Klicken Sie auf HTTP-Aufrufe ausführen.

    Configuration um.

  4. Wählen Sie PUT aus.

  5. Geben Sie im Pfadfeld namespaces/NAMESPACE_ID/securekeys/password ein.

  6. Geben Sie im Feld Body den Wert {"data":"password"} ein. Ersetzen Sie password durch Ihr SQL Server-Passwort.

  7. Klicken Sie auf Send.

    Passwort

Die Antwort muss den Statuscode 200 haben, um fortzufahren.

JDBC-Treiber für SQL Server abrufen

Sie können den Treiber aus dem Hub oder in Pipeline Studio in Cloud Data Fusion abrufen.

Hub

  1. Klicken Sie in der Cloud Data Fusion-UI auf Hub.

  2. Geben Sie in der Suchleiste SQL Server JDBC Driver ein und wählen Sie den Fahrer aus.

  3. Klicken Sie auf Herunterladen. Führen Sie die angezeigten Schritte aus.

  4. Klicken Sie auf Bereitstellen. Laden Sie die JAR-Datei aus dem vorherigen Schritt hoch.

  5. Klicken Sie auf Finish (Beenden).

Pipeline Studio

  1. Rufen Sie Microsoft.com auf.

  2. Wählen Sie einen Download aus und klicken Sie auf Herunterladen.

  3. Klicken Sie in Cloud Data Fusion auf Menü und rufen Sie die Seite Pipeline Studio auf.

  4. Klicken Sie auf Hinzufügen.

  5. Klicken Sie für den Treiber auf Hochladen.

  6. Wählen Sie die JAR-Datei im Ordner jre7 aus.

  7. Klicken Sie auf Next (Weiter).

  8. Geben Sie einen Namen und einen Klassennamen ein, um den Treiber zu konfigurieren.

  9. Klicken Sie auf Finish (Beenden).

SQL Server-Plug-in bereitstellen

  1. Klicken Sie in Cloud Data Fusion auf Hub.

  2. Geben Sie in der Suchleiste SQL Server Plugins ein.

  3. Klicken Sie auf SQL Server-Plug-ins.

  4. Klicken Sie auf Bereitstellen.

  5. Klicken Sie auf Beenden.

  6. Klicken Sie auf Pipeline erstellen.

Mit SQL Server verbinden

Sie können über Cloud Data Fusion in Wrangler oder Pipeline Studio eine Verbindung zu SQL Server herstellen.

Wrangler

  1. Klicken Sie in Cloud Data Fusion auf Menü und rufen Sie die Seite Wrangler auf.

  2. Klicken Sie auf Verbindung hinzufügen.

    Das Fenster Verbindung hinzufügen wird geöffnet.

  3. Klicken Sie auf SQL Server, um zu prüfen, ob der Treiber installiert ist.

    JAR-Datei hochgeladen.

  4. Geben Sie Details in die erforderlichen Felder für die Verbindung ein. Wählen Sie im Feld Passwort den zuvor gespeicherten Schlüssel aus. Er sorgt dafür, dass Ihr Passwort über Cloud KMS abgerufen wird.

    Passwort auswählen

  5. Klicken Sie auf Verbindung testen, um zu prüfen, ob eine Verbindung zur Datenbank hergestellt werden kann.

  6. Klicken Sie auf Verbindung hinzufügen.

Nachdem die SQL Server-Datenbank verbunden und Sie eine Pipeline erstellt haben, die Daten aus Ihrer SQL Server-Tabelle liest, können Sie Transformationen anwenden und die Ausgabe in eine Senke schreiben.

Pipeline Studio

  1. Öffnen Sie die Cloud Data Fusion-Instanz und rufen Sie die Seite Pipeline Studio auf.

  2. Maximieren Sie das Menü Quelle und klicken Sie auf SQL Server.

    SQL Server.

  3. Klicken Sie im Knoten SQL Server auf Eigenschaften.

    Properties.
  4. Geben Sie im Feld Referenzname einen Namen ein, der die SQL Server-Quelle identifiziert.

  5. Geben Sie im Feld Datenbank den Namen der Datenbank ein, zu der Sie eine Verbindung herstellen möchten.

  6. Geben Sie im Feld Abfrage importieren die Abfrage ein, die ausgeführt werden soll. Beispiel: SELECT * FROM table WHERE $CONDITIONS

  7. Klicke auf Validieren.

  8. Klicken Sie auf „Schließen“ .

Nachdem die SQL Server-Datenbank verbunden ist und Sie eine Pipeline erstellt haben, die Daten aus Ihrer SQL Server-Tabelle liest, fügen Sie die gewünschten Transformationen hinzu und schreiben Sie die Ausgabe in eine Senke.

Nächste Schritte