Auf dieser Seite wird beschrieben, wie Sie Ihre Datenpipeline so einrichten, dass Daten aus einer Microsoft SQL Server-Tabelle gelesen werden.
Hinweis
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc APIs.
- Erstellen Sie eine Cloud Data Fusion-Instanz.
- Ihre SQL Server-Datenbank muss Verbindungen von Cloud Data Fusion akzeptieren. Verwenden Sie aus Sicherheitsgründen eine private Cloud Data Fusion-Instanz.
Cloud Data Fusion-Instanz öffnen
Rufen Sie in der Google Cloud Console die Seite Cloud Data Fusion-Instanzen auf.
Klicken Sie in der Spalte Aktionen für die Instanz auf Instanz aufrufen, um die Instanz in Cloud Data Fusion zu öffnen.
SQL Server-Passwort als sicheren Schlüssel speichern
Fügen Sie Ihr SQL Server-Passwort als sicheren Schlüssel in Ihrer Cloud Data Fusion-Instanz hinzu.
Klicken Sie in Cloud Data Fusion auf Systemadministrator.
Klicken Sie auf den Tab Konfiguration.
Klicken Sie auf HTTP-Aufrufe ausführen.
Wählen Sie PUT aus.
Geben Sie im Feld „Pfad“ den Wert
namespaces/NAMESPACE_ID/securekeys/password
ein.Geben Sie im Feld Body den Wert
{"data":"password"}
ein. Ersetzen Sie password durch Ihr SQL Server-Passwort.Klicken Sie auf Send.
Die Antwort muss den Statuscode 200
haben, um fortzufahren.
JDBC-Treiber für SQL Server abrufen
Sie können den Treiber im Hub oder in Pipeline Studio in Cloud Data Fusion abrufen.
Hub
Klicken Sie in der Cloud Data Fusion-Benutzeroberfläche auf Hub.
Geben Sie in die Suchleiste
SQL Server JDBC Driver
ein und wählen Sie den Treiber aus.Klicken Sie auf Herunterladen. Führen Sie die angezeigten Schritte aus.
Klicken Sie auf Bereitstellen. Laden Sie die JAR-Datei aus dem vorherigen Schritt hoch.
Klicken Sie auf Beenden.
Pipeline Studio
Rufen Sie Microsoft.com auf.
Wählen Sie einen Download aus und klicken Sie auf Herunterladen.
Klicken Sie in Cloud Data Fusion auf das Dreistrich-Menü menu und rufen Sie die Seite Pipeline Studio auf.
Klicken Sie auf
Hinzufügen.Klicken Sie für den Treiber auf Hochladen.
Wählen Sie die JAR-Datei aus, die sich im Ordner
jre7
befindet.Klicken Sie auf Weiter.
Geben Sie einen Namen und einen Klassennamen ein, um den Treiber zu konfigurieren.
Klicken Sie auf Beenden.
SQL Server-Plug-in bereitstellen
Klicken Sie in Cloud Data Fusion auf Hub.
Geben Sie in der Suchleiste
SQL Server Plugins
ein.Klicken Sie auf SQL Server-Plug-ins.
Klicken Sie auf Bereitstellen.
Klicken Sie auf Beenden.
Klicken Sie auf Pipeline erstellen.
Mit SQL Server verbinden
Sie können in Cloud Data Fusion in Wrangler oder Pipeline Studio eine Verbindung zu SQL Server herstellen.
Wrangler
Klicken Sie in Cloud Data Fusion auf das Dreistrich-Menü menu und rufen Sie die Seite Wrangler auf.
Klicken Sie auf Verbindung hinzufügen.
Das Fenster Verbindung hinzufügen wird geöffnet.
Klicken Sie auf SQL Server, um zu prüfen, ob der Treiber installiert ist.
Geben Sie die erforderlichen Details in die entsprechenden Felder ein. Wählen Sie im Feld Passwort den zuvor gespeicherten Schlüssel aus. Dadurch wird Ihr Passwort mit Cloud KMS abgerufen.
Klicken Sie auf Verbindung testen, um zu prüfen, ob eine Verbindung mit der Datenbank hergestellt werden kann.
Klicken Sie auf Verbindung hinzufügen.
Nachdem Ihre SQL Server-Datenbank verbunden ist und Sie eine Pipeline erstellt haben, die aus Ihrer SQL Server-Tabelle liest, können Sie Transformationen anwenden und die Ausgabe in eine Senke schreiben.
Pipeline Studio
Öffnen Sie Ihre Cloud Data Fusion-Instanz und rufen Sie die Seite Pipeline Studio auf.
Maximieren Sie das Menü Quelle und klicken Sie auf SQL Server.
Klicken Sie unter SQL Server auf Eigenschaften.
Geben Sie im Feld Referenzname einen Namen ein, der Ihre SQL Server-Quelle identifiziert.
Geben Sie in das Feld Datenbank den Namen der Datenbank ein, mit der eine Verbindung hergestellt werden soll.
Geben Sie im Feld Abfrage importieren die Abfrage ein, die ausgeführt werden soll. Beispiel:
SELECT * FROM table WHERE $CONDITIONS
Klicke auf Validieren.
Klicken Sie auf „Schließen“
.
Nachdem Ihre SQL Server-Datenbank verbunden ist und Sie eine Pipeline erstellt haben, die aus Ihrer SQL Server-Tabelle liest, fügen Sie die gewünschten Transformationen hinzu und schreiben Sie die Ausgabe in eine Senke.
Nächste Schritte
- Daten aus mehreren SQL Server-Tabellen lesen.
- Weitere Informationen zu Cloud Data Fusion
- Folgen Sie einer der Anleitungen.