Daten aus SAP S/4HANA über SAP Datasphere in BigQuery replizieren

Dieses Dokument bietet einen Überblick darüber, wie Sie Daten aus SAP S/4HANA über SAP Datasphere in BigQuery replizieren können. SAP Datasphere bietet robuste Funktionen zur Datentransformation und sorgt dafür, dass die Daten ordnungsgemäß in BigQuery geladen werden. Die BigQuery Storage Write API wird verwendet, um die Daten nahezu in Echtzeit in das BigQuery-Dataset zu schreiben.

Replikationsmethoden

Zum Lesen von Daten aus dem SAP S/4HANA-Quellsystem können Sie eine der folgenden Replikationsmethoden verwenden:

  • CDS-basierte Replikation: Bei dieser Methode werden CDS-Ansichten (Core Data Services) verwendet. Diese sind semantisch umfassend und bieten vordefinierte Modelle Ihrer Geschäftsdaten in SAP S/4HANA.

  • SLT-basierte Replikation: Bei dieser Methode werden die zugrunde liegenden Datenbanktabellen direkt aus Ihrem SAP S/4HANA-System repliziert. Dabei wird normalerweise SAP Landscape Transformation (SLT) als Replikationstechnologie verwendet. Die replizierten Tabellen können dann als Datengrundlage für Google Cloud Cortex Framework verwendet werden.

Wichtige Unterschiede und Überlegungen

In der folgenden Tabelle sind die wichtigsten Unterschiede zwischen den beiden Replikationsmethoden zusammengefasst:

Funktion CDS-basierte Replikation SLT-basierte Replikation
Datendarstellung Bietet geschäftsorientierte Datenansichten, in denen häufig Daten aus mehreren Tabellen in sinnvollen Strukturen kombiniert werden. Direkter Zugriff auf Rohtabellenstrukturen Wenn Sie eine detaillierte Kontrolle über Daten benötigen oder benutzerdefinierte Tabellen replizieren müssen, ist diese Replikationsmethode für Ihre Anforderungen geeignet.
Nutzerfreundlichkeit Wenn Sie die vorab bereitgestellten CDS-Ansichten in SAP Datasphere verwenden, wird die Einrichtung der Replikation einfacher. Erfordert möglicherweise weitere technische Konfigurationen, insbesondere für die Ersteinrichtung von SLT und die Verarbeitung von Tabellenabhängigkeiten.
Flexibilität Weniger flexibel, wenn Sie benutzerdefinierte Tabellen oder Tabellen replizieren müssen, die nicht über Standard-CDS-Ansichten verfügbar gemacht werden. Bietet mehr Flexibilität beim Replizieren jeder Tabelle, auch benutzerdefiniert entwickelter.
Leistung
  • Verursacht aufgrund der Geschäftslogik und Deltaberechnungen einen zusätzlichen CPU-Verbrauch in der Produktionsdatenbank. Für diese Methode sind möglicherweise zusätzliche CPU-Ressourcen für Ihre SAP-Datenbank erforderlich.
  • Aufgrund möglicher Voraggregationen in der CDS-Ansichtslogik werden weniger Daten übertragen.
  • Repliziert ganze Tabellen, was zu einem erhöhten Netzwerktraffic führt. Daher ist diese Methode netzwerkintensiv. Dies erfordert jedoch weniger Verbrauch der Datenbank-CPU-Ressourcen.
  • Da vollständige Tabellen ohne Vorabaggregationen repliziert werden, werden mehr Daten übertragen.
Kompatibilität mit Google Cortex Framework Nicht mit vorab bereitgestellten technischen Beschleunigern kompatibel. Vollständig mit vorab bereitgestellten technischen Beschleunigern kompatibel.

Replikationsmethode auswählen

Die für Sie am besten geeignete Replikationsmethode hängt von mehreren Faktoren ab, einschließlich des beabsichtigten Anwendungsfalls und weiteren Aspekten wie den folgenden:

  • Geschäftsanforderungen: Wenn Sie hauptsächlich Standardgeschäftsdaten benötigen und eine schnelle Einrichtung wünschen, ist die CDS-basierte Replikation wahrscheinlich eine gute Wahl. Wenn Sie spezialisierte Daten oder stark benutzerdefinierte Tabellen benötigen, sollten Sie die SLT-basierte Replikation in Betracht ziehen.

  • Cortex-Framework-Kompatibilität. Wenn Sie Cortex Framework verwenden möchten, verwenden Sie die SLT-basierte Replikation.

  • Technisches Fachwissen: Die CDS-basierte Replikation ist für Nutzer mit SAP Basis- oder Datenreplikationskenntnissen einfacher.

  • Datenvolumen und -komplexität: Bei Multi-Terabyte-Daten oder komplexen Tabellenbeziehungen kann die SLT-basierte Replikation skalierbarer sein.

Nächste Schritte