Répliquer les données de SAP S/4HANA vers BigQuery à l'aide de SAP Datasphere

Ce document explique comment répliquer des données de SAP S/4HANA vers BigQuery via SAP Datasphere. SAP Datasphere offre des capacités de transformation des données robustes et garantit que les données sont correctement chargées dans BigQuery. Il utilise l'API BigQuery Storage Write pour écrire les données dans l'ensemble de données BigQuery quasiment en temps réel.

Méthodes de réplication

Pour lire les données du système source SAP S/4HANA, vous pouvez utiliser l'une des méthodes de réplication suivantes:

  • Réplication basée sur CDS: cette méthode utilise des vues Core Data Services (CDS), qui sont sémantiquement riches et offrent des modèles prédéfinis de vos données d'entreprise dans SAP S/4HANA.

  • Réplication basée sur S/T: cette méthode réplique directement les tables de base de données sous-jacentes de votre système SAP S/4HANA, en utilisant généralement SAP Landscape Transformation (SLT) comme technologie de réplication. Les tables répliquées peuvent ensuite être utilisées comme base de données pour Google Cloud Cortex Framework.

Différences et points clés à prendre en compte

Le tableau suivant récapitule les principales différences entre les deux méthodes de réplication:

Caractéristique Réplication basée sur CDS Réplication basée sur SLT
Représentation des données Fournit des vues de données axées sur l'entreprise, en combinant souvent les données de plusieurs tables dans des structures significatives. Fournit un accès direct aux structures de table brutes. Si vous avez besoin d'un contrôle précis des données ou si vous devez répliquer des tables personnalisées, cette méthode de réplication est adaptée à vos besoins.
Simplicité d'utilisation Si vous utilisez les vues CDS pré-distribuées dans SAP Datasphere, la configuration de la réplication devient plus simple. Peut nécessiter des configurations plus techniques, en particulier pour la configuration initiale de SLT et la gestion des dépendances de table.
Flexibilité Moins flexible si vous devez répliquer des tables personnalisées ou des tables non exposées via des vues CDS standards. Offre une plus grande flexibilité pour répliquer n'importe quelle table, y compris celles développées sur mesure.
Performances
  • Entraîne une consommation supplémentaire de processeur sur la base de données de production en raison de la logique métier et des calculs delta. Cette méthode peut nécessiter des ressources de processeur supplémentaires pour votre base de données SAP.
  • Moins de données sont transférées en raison de pré-agrégations possibles dans la logique de vue CDS.
  • Réplique des tables entières, ce qui augmente le trafic réseau. Par conséquent, cette méthode nécessite une utilisation intensive de la mise en réseau. Cependant, elle nécessite moins de consommation des ressources de processeur de la base de données.
  • D'autres données sont transférées à mesure que des tables complètes sont répliquées sans pré-agrégations.
Compatibilité avec Google Cortex Framework Non compatible avec les accélérateurs techniques pré-fournis. Entièrement compatible avec les accélérateurs techniques pré-fournis.

Choisir la méthode de réplication

La méthode de réplication la mieux adaptée dépend de plusieurs facteurs, y compris le cas d'utilisation prévu et d'autres considérations, telles que les suivantes:

  • Exigences métier: si vous avez principalement besoin de données d'entreprise standards et que vous souhaitez une configuration rapide, la réplication basée sur les CDS est probablement adaptée. Si vous avez besoin de données plus spécialisées ou si vous disposez de tables hautement personnalisées, envisagez une réplication basée sur SLT.

  • Compatibilité avec Cortex Framework. Si vous souhaitez utiliser Cortex Framework, utilisez la réplication basée sur SLT.

  • Expertise technique: la réplication basée sur un CDS est plus facile à mettre en œuvre pour les personnes disposant de SAP Basis ou d'une expertise en réplication de données.

  • Volume et complexité des données: pour les données de plusieurs téraoctets ou les relations de tables complexes, la réplication basée sur SLT peut être plus évolutive.

Étape suivante