CDS-basierte Replikation einrichten: SAP S/4HANA zu BigQuery über SAP Datasphere

Mit dem Feature Replikationsablauf von SAP Datasphere können Sie Daten aus SAP S/4HANA in BigQuery replizieren.

In diesem Leitfaden wird erläutert, wie Sie Daten von SAP S/4HANA über SAP Datasphere in BigQuery replizieren, wenn Sie eine auf Core Data Services (CDS) basierende Replikation für SAP S/4HANA verwenden.

Es müssen allgemein folgende Schritte ausgeführt werden:

  1. SAP Datasphere mit dem SAP S/4HANA-Quellsystem verbinden
  2. Verbinden Sie SAP Datasphere mit dem Google Cloud-Projekt, das das BigQuery-Ziel-Dataset enthält.
  3. Erstellen Sie einen Replikationsablauf.
  4. Führen Sie den Replikationsvorgang aus.
  5. Replizierte Daten in BigQuery validieren.

Informationen zum Einrichten der SLT-basierten Replikation finden Sie unter SLT-basierte Replikation einrichten: SAP S/4HANA zu BigQuery über SAP Datasphere.

Hinweise

Bevor Sie beginnen, sollten Sie prüfen, ob Sie oder Ihre Administratoren die folgenden Voraussetzungen erfüllen:

SAP Datasphere mit dem SAP S/4HANA-Quellsystem verbinden

Dieser Abschnitt enthält eine Anleitung zum Herstellen einer Verbindung zwischen SAP Datasphere und dem SAP S/4HANA-Quellsystem.

SAP Cloud-Connector installieren

Zum sicheren Verbinden Ihres SAP Datasphere-Mandanten mit dem SAP S/4HANA-Quellsystem ist SAP Cloud Connector erforderlich, wenn Ihr SAP S/4HANA-Quellsystem vor Ort läuft, in einer beliebigen Cloud-Umgebung gehostet wird oder wenn Sie die SAP S/4HANA Cloud Private Edition verwenden. Wenn Sie jedoch die Cloud Public Edition von SAP S/4HANA verwenden, wird der SAP Cloud-Connector nicht benötigt. Überspringen Sie in diesem Fall die Installation und Konfiguration von SAP Cloud Connector und fahren Sie mit Verbindung zum SAP S/4HANA-Quellsystem erstellen fort.

Wenn Ihr SAP S/4HANA-Quellsystem lokal ausgeführt wird oder in einer beliebigen Cloud-Umgebung gehostet wird, müssen Sie den SAP Cloud Connector auf Ihrem Betriebssystem installieren und konfigurieren. Informationen zu betriebssystemspezifischen Anforderungen und Anleitungen zum Installieren von SAP Cloud Connector finden Sie in der SAP-Dokumentation Cloud Connector-Konnektivität vorbereiten.

Wenn Sie die SAP S/4HANA Cloud Private Edition verwenden, ist der SAP Cloud-Connector im Rahmen der SAP S/4HANA-Einrichtung vorinstalliert. Überspringen Sie in diesem Fall die Installation des SAP Cloud-Connectors und fahren Sie mit SAP Cloud-Connector konfigurieren fort.

SAP Cloud-Connector konfigurieren

Sie konfigurieren SAP Cloud Connector so, dass das SAP Datasphere-Unterkonto, die Zuordnung zum SAP S4/HANA-Quellsystem in Ihrem Netzwerk und die zugänglichen Ressourcen angegeben werden.

In diesem Abschnitt werden die wichtigsten Schritte bei der Konfiguration von SAP Cloud-Connector aufgeführt. Ausführliche Informationen zum Konfigurieren von SAP Cloud-Connector finden Sie in der SAP-Dokumentation Cloud-Connector konfigurieren.

Die wichtigsten Schritte sind:

  1. Greifen Sie in Ihrem Webbrowser über den Host, auf dem Ihr SAP Cloud Connector installiert ist, und den Port auf die Verwaltungs-UI von SAP Cloud Connector zu. Beispiel: http://localhost:8443.

  2. Melden Sie sich bei SAP Cloud-Connector an. Wenn Sie sich zum ersten Mal nach der Installation von SAP Cloud Connector anmelden, verwenden Sie die folgenden Standardanmeldedaten:

    • Nutzername: Administrator
    • Passwort: manage

    Ändern Sie das Standardpasswort, bevor Sie fortfahren. Weitere Informationen finden Sie in der SAP-Dokumentation unter Erstkonfiguration.

  3. Geben Sie die folgenden Details an, um Ihren SAP Cloud Connector mit Ihrem SAP BTP-Unterkonto zu verbinden:

    • Details zu Ihrem SAP Datasphere-Unterkonto, einschließlich Name des Unterkontos, Region und Unterkonto. Weitere Informationen zu diesen Feldern finden Sie in der SAP-Dokumentation Cloud Connector konfigurieren.
    • Für das angegebene Unterkonto eine Standort-ID, die den Standort Ihres SAP Cloud-Connectors angibt.
  4. Fügen Sie die Informationen zur Systemzuordnung hinzu, einschließlich der Informationen zum internen Host und zum virtuellen Hostsystem, um Zugriff auf das SAP S/4HANA-Quellsystem zu gewähren.

  5. Für den Zugriff auf Daten mit der CDS-Ansichtsextraktion müssen Sie die folgenden Ressourcen angeben:

    • DHAMB_ -Präfix
    • DHAPE_ -Präfix
    • RFC_FUNCTION_SEARCH

  6. Speichern Sie Ihre Konfiguration.

Verbindung zum SAP S/4HANA-Quellsystem erstellen

Erstellen Sie in SAP Datasphere eine lokale Verbindung, um das SAP S/4HANA-Quellsystem für den Datenzugriff zu verwenden. Sie verwenden diese Verbindung, um Replikationsabläufe zu erstellen.

Führen Sie die folgenden Schritte aus, um eine Verbindung zum SAP S/4HANA-Quellsystem zu erstellen:

  1. Rufen Sie in SAP Datasphere Connections auf und wählen Sie Ihren Bereich aus.

  2. Erstellen Sie eine lokale Verbindung zum ABAP-System vom Verbindungstyp SAP S/4HANA lokal:

    1. Konfigurieren Sie die Verbindungsattribute gemäß Ihrer SAP Cloud-Connector-Konfiguration.
    2. Geben Sie die Details zum virtuellen Host ein, die Sie während der SAP Cloud-Connector-Konfiguration definiert haben.

    Informationen zum Verbindungstyp SAP S/4HANA On-Prem finden Sie in der SAP-Dokumentation Lokale SAP S/4HANA-Verbindungen.

  3. Wählen Sie die Verbindung aus und klicken Sie auf das Symbol Verbindung validieren, um die Verbindung zwischen SAP Datasphere und SAP S/4HANA zu prüfen.

Weitere Informationen zum Erstellen einer Verbindung zwischen SAP Datasphere und SAP S/4HANA finden Sie in der SAP-Dokumentation Verbindung erstellen.

Bevor Sie die Verbindung für Replikationsabläufe verwenden können, prüfen Sie die SAP-Hinweise, die für Replikationsabläufe relevant sind, und implementieren Sie alle erforderlichen Hinweise auf Ihrem SAP S/4HANA-System. Weitere Informationen zu den erforderlichen SAP-Hinweisen finden Sie hier:

SAP Datasphere mit Google Cloud-Projekt verbinden

In diesem Abschnitt wird beschrieben, wie Sie eine Verbindung zwischen SAP Datasphere und Ihrem Google Cloud-Projekt herstellen, das das BigQuery-Ziel-Dataset enthält.

Dienstkonto erstellen

Zur Authentifizierung und Autorisierung von SAP Datasphere benötigen Sie ein IAM-Dienstkonto in Ihrem Google Cloud-Projekt. Sie weisen dem Dienstkonto, das Berechtigungen zur Interaktion mit BigQuery enthält, Rollen zu.

Außerdem müssen Sie für das Dienstkonto einen JSON-Schlüssel erstellen. Sie laden den JSON-Schlüssel in SAP Datasphere hoch, um sich bei Google Cloud zu authentifizieren.

Führen Sie die folgenden Schritte aus, um ein Dienstkonto zu erstellen:

  1. Rufen Sie in der Google Cloud Console die IAM und Verwaltung-Seite Dienstkonten auf.

    Zur Seite „Dienstkonten“

  2. Wählen Sie bei entsprechender Aufforderung Ihr Google Cloud-Projekt aus.

  3. Klicken Sie auf Dienstkonto erstellen.

  4. Geben Sie einen Namen für das Dienstkonto und optional eine Beschreibung an.

  5. Klicken Sie auf Erstellen und fortfahren.

  6. Wählen Sie im Bereich Diesem Dienstkonto Zugriff auf das Projekt erteilen die folgenden Rollen aus:

    • BigQuery-Dateninhaber
    • BigQuery-Jobnutzer
  7. Klicken Sie auf Weiter.

  8. Klicken Sie auf Fertig. Das Dienstkonto wird in der Liste der Dienstkonten für das Projekt angezeigt.

JSON-Schlüssel für das Dienstkonto herunterladen

Führen Sie die folgenden Schritte aus, um einen JSON-Schlüssel für das Dienstkonto herunterzuladen:

  1. Klicken Sie auf die E-Mail-Adresse des Dienstkontos, für das Sie einen Schlüssel erstellen möchten.
  2. Klicken Sie auf den Tab Schlüssel.
  3. Klicken Sie auf das Drop-down-Menü Schlüssel hinzufügen und wählen Sie Neuen Schlüssel erstellen aus.
  4. Wählen Sie als Schlüsseltyp JSON aus und klicken Sie dann auf Erstellen.

Wenn Sie auf Erstellen klicken, wird eine Dienstkontoschlüsseldatei heruntergeladen. Bewahren Sie die Schlüsseldatei sicher auf, da sie zur Authentifizierung als Ihr Dienstkonto verwendet werden kann. Weitere Informationen finden Sie unter Dienstkontoschlüssel erstellen und löschen.

BigQuery-Dataset erstellen

Zum Erstellen eines BigQuery-Datasets muss Ihr Nutzerkonto die richtigen IAM-Berechtigungen für BigQuery haben. Weitere Informationen finden Sie unter Erforderliche Berechtigungen.

Führen Sie die folgenden Schritte aus, um ein BigQuery-Dataset zu erstellen:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery:

    BigQuery aufrufen

  2. Klicken Sie neben Ihrer Projekt-ID auf das Symbol Aktionen ansehen und dann auf Dataset erstellen.

  3. Geben Sie im Feld Dataset-ID einen eindeutigen Namen ein. Weitere Informationen finden Sie unter Datasets benennen.

  4. Wählen Sie im Feld Standorttyp einen geografischen Standort für das Dataset aus, das Sie verwenden möchten. Nachdem ein Dataset erstellt wurde, kann der Standort nicht mehr geändert werden.

Weitere Informationen zum Erstellen von BigQuery-Datasets finden Sie unter Datasets erstellen.

SSL-Zertifikate in SAP Datasphere hochladen

Zum Verschlüsseln der zwischen SAP und Google Cloud übertragenen Daten müssen Sie die erforderlichen Google SSL-Zertifikate in SAP Datasphere hochladen.

Führen Sie die folgenden Schritte aus, um die SSL-Zertifikate hochzuladen:

  1. Laden Sie aus dem Repository von Google Trust Services die folgenden Zertifikate herunter:

    • GTS Root R1
    • GTS CA 1C3
  2. Gehen Sie in SAP Datasphere zu System > Konfiguration > Sicherheit.

  3. Klicken Sie auf Zertifikat hinzufügen.

  4. Suchen Sie in Ihrem lokalen Verzeichnis und wählen Sie die Zertifikate aus, die Sie aus dem Repository von Google Trust Services heruntergeladen haben.

  5. Klicken Sie auf Hochladen.

Weitere Informationen von SAP über das Hochladen von Zertifikaten in SAP Datasphere finden Sie unter Zertifikate für Verbindungen verwalten.

Treiber für BigQuery in SAP Datasphere hochladen

Der BigQuery-ODBC-Treiber fungiert als Brücke zwischen SAP Datasphere und BigQuery für Replikationsabläufe. Für den Zugriff auf BigQuery müssen Sie die erforderlichen ODBC-Treiberdateien in SAP Datasphere hochladen.

Weitere Informationen von SAP zum Hochladen der erforderlichen ODBC-Treiberdateien in SAP Datasphere finden Sie unter ODBC-Treiber von Drittanbietern hochladen (für Datenflüsse erforderlich).

Führen Sie die folgenden Schritte aus, um die Treiberdateien hochzuladen:

  1. Laden Sie von ODBC- und JDBC-Treiber für BigQuery den erforderlichen BigQuery-ODBC-Treiber herunter.

  2. Gehen Sie in SAP Datasphere zu System > Konfiguration > Datenintegration.

  3. Gehen Sie zu Drittanbietertreiber und klicken Sie auf Hochladen.

  4. Suchen Sie in Ihrem lokalen Verzeichnis und wählen Sie die Treiberdatei aus, die Sie von ODBC- und JDBC-Treibern für BigQuery heruntergeladen haben.

  5. Klicken Sie auf Hochladen.

  6. Klicken Sie auf Synchronisieren, um die Treiberänderungen zu synchronisieren. Nach Abschluss der Synchronisierung können Sie Datenflüsse mit der Verbindung verwenden.

Verbindung zum Google Cloud-Projekt erstellen

Wenn Sie Daten aus Ihrem SAP S/4HANA-Quellsystem in das BigQuery-Ziel-Dataset replizieren möchten, müssen Sie in Ihrem SAP Datasphere-Mandanten einen Replikationsablauf erstellen.

Führen Sie die folgenden Schritte aus, um eine Verbindung zum Google Cloud-Projekt zu erstellen:

  1. Rufen Sie in SAP Datasphere Connections auf und erstellen Sie eine neue Verbindung in Ihrem Bereich.

  2. Wählen Sie als Verbindungstyp Google BigQuery aus.

  3. Geben Sie in den Abschnitten Verbindungsdetails Folgendes an:

    • Projekt-ID: Geben Sie Ihre Google Cloud-Projekt-ID in Kleinbuchstaben ein.
    • Speicherort: Geben Sie den Standort Ihres Google Cloud-Projekts ein.
  4. Laden Sie im Abschnitt Anmeldedaten die JSON-Schlüsseldatei hoch, die für die Authentifizierung verwendet wird. Weitere Informationen finden Sie unter JSON-Schlüssel für das Dienstkonto herunterladen.

  5. Wählen Sie Ihre Verbindung aus und klicken Sie auf das Symbol Verbindung validieren, um die Verbindung zwischen SAP Datasphere und BigQuery zu prüfen.

Weitere Informationen von SAP über die Verbindung zum Herstellen einer Verbindung zu BigQuery und den Zugriff auf Daten von BigQuery finden Sie unter Google BigQuery-Verbindungen.

Replikationsablauf erstellen

Sie erstellen einen Replikationsablauf, um SAP-Daten aus Ihrem SAP S/4HANA-Quellsystem in das BigQuery-Ziel-Dataset zu kopieren.

Führen Sie die folgenden Schritte aus, um einen Replikationsablauf über CDS zu erstellen:

  1. Wechseln Sie in SAP Datasphere zu Data Builder und klicken Sie auf Neuer Replikationsfluss.

  2. Geben Sie die Quelle für den Replikationsablauf an:

    1. Wählen Sie die Quellverbindung vom Typ SAP S/4HANA On-Prem aus, die Sie im Abschnitt Verbindung zum SAP S/4HANA-Quellsystem erstellen erstellt haben.

    2. Wählen Sie CDS_EXTRATION – Für die Datenextraktion aktivierte CDS-Ansichten als Quellcontainer aus.

    3. Fügen Sie nach Bedarf Quellobjekte hinzu.

      Weitere Informationen finden Sie in der SAP-Dokumentation unter Quelle hinzufügen.

  3. Geben Sie die Zielumgebung für den Replikationsablauf an:

    1. Wählen Sie die Verbindung zu dem Google Cloud-Projekt aus, das das BigQuery-Ziel-Dataset enthält.

    2. Wählen Sie den Container aus, also das Dataset in BigQuery, in das Sie Ihre Daten replizieren möchten.

      Weitere Informationen finden Sie in der SAP-Dokumentation unter Ziel hinzufügen.

  4. Erstellen Sie Zuordnungen, um festzulegen, wie die Quelldaten auf dem Weg zum Ziel geändert werden sollen. Weitere Informationen finden Sie in der SAP-Dokumentation Zuordnung definieren.

  5. Speichern Sie den Replikationsablauf.

  6. Stellen Sie den Replikationsablauf bereit.

Weitere Informationen finden Sie in der SAP-Dokumentation Replikationsablauf erstellen.

Replikationsvorgang ausführen

Sobald der Replikationsablauf konfiguriert und bereitgestellt wurde, können Sie ihn ausführen.

  • Wählen Sie zum Ausführen eines Replikationsvorgangs den Replikationsvorgang aus und klicken Sie auf Ausführen.

    Anschließend wird der Bereich Ausführungsstatus im Steuerfeld Eigenschaft aktualisiert. Weitere Informationen finden Sie in der SAP-Dokumentation Ablauf ausführen.

Status des Replikationsflusses überwachen

Sie können die Ausführungsdetails von Replikationsabläufen aufrufen und überwachen.

Führen Sie die folgenden Schritte aus, um den Status des Replikationsflusses zu überwachen:

  1. Wechseln Sie in SAP Datasphere zuMonitoring zur Datenintegration> Abläufe

  2. Wählen Sie im linken Bereich eine Ablaufausführung aus, um dessen Details aufzurufen.

Weitere Informationen finden Sie in der SAP-Dokumentation unter Abläufe überwachen.

Replizierte Daten in BigQuery validieren

Prüfen Sie nach Abschluss des Replikationsvorgangs die replizierte Tabelle und die Daten in BigQuery.

Zum Validieren der replizierten Daten in BigQuery führen Sie folgende Schritte aus:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    BigQuery aufrufen

  2. Maximieren Sie im Abschnitt Explorer Ihr Projekt, um das Dataset und seine Tabellen aufzurufen.

  3. Wählen Sie die erforderliche Tabelle aus. Die Tabelleninformationen werden auf einem Tab im Inhaltsbereich rechts auf der Seite angezeigt.

  4. Klicken Sie im Abschnitt "Tabelleninformationen" auf die folgenden Überschriften, um die SAP-Daten aufzurufen:

    • Vorschau: zeigt die aus dem SAP S/4HANA-Quellsystem replizierten Daten an.
    • Details: Zeigt die Tabellengröße, die Gesamtzahl der Zeilen und andere Details an.