SAP Datasphere を介した SAP S/4HANA から BigQuery へのデータのレプリケート

このドキュメントでは、SAP Datasphere を介して SAP S/4HANA から BigQuery にデータを複製する方法の概要について説明します。SAP Datasphere は、強力なデータ変換機能を備えており、データが BigQuery に正しく読み込まれることを保証します。BigQuery Storage Write API を使用して、データを BigQuery データセットに準リアルタイムで書き込みます。

レプリケーション方法

SAP S/4HANA ソースシステムからデータを読み取るには、次のいずれかのレプリケーション方法を使用します。

  • CDS ベースのレプリケーション: この方法では、コアデータ サービス(CDS)ビューを使用します。このビューは意味的に豊富で、SAP S/4HANA 内のビジネスデータの事前定義モデルを提供します。

  • SLT ベースのレプリケーション: この方法では、通常、レプリケーション テクノロジーとして SAP Landscape Transformation(SLT)を使用して、SAP S/4HANA システムから基盤となるデータベース テーブルを直接複製します。複製されたテーブルは、Google Cloud Cortex Framework のデータ基盤として使用できます。

主な違いと考慮事項

次の表は、2 つのレプリケーション方法の主な違いをまとめたものです。

機能 CDS ベースのレプリケーション SLT ベースのレプリケーション
データ表現 ビジネス指向のデータビューを提供します。多くの場合、複数のテーブルのデータを組み合わせて意味のある構造にします。 未加工のテーブル構造に直接アクセスできます。データをきめ細かく制御する必要がある場合や、カスタム テーブルを複製する必要がある場合は、このレプリケーション方法が適しています。
使いやすさ SAP Datasphere で事前提供の CDS ビューを使用している場合、レプリケーションの設定はより簡単になります。 特に SLT の初期設定とテーブルの依存関係の処理では、より多くの技術的な構成が必要になる場合があります。
柔軟性 カスタム テーブルや標準の CDS ビューで公開されていないテーブルを複製する必要がある場合、柔軟性が低くなります。 カスタム開発されたテーブルを含む、任意のテーブルを複製する柔軟性が向上します。
パフォーマンス
  • ビジネス ロジックと差分計算により、本番環境データベースで CPU 消費量が増加します。この方法では、SAP データベースに CPU リソースを追加で割り当てる必要があります。
  • CDS ビューロジックで事前集計が可能であるため、転送されるデータ量が削減されます。
  • テーブル全体を複製することにより、ネットワーク トラフィックが増加するため、この方法ではネットワーク使用率が高くなります。ただし、データベース CPU リソースの消費量は少なくなります。
  • 事前集計なしでテーブル全体が複製されるため、より多くのデータが転送されます。
Google Cortex Framework の互換性 事前に提供された技術的なアクセラレータには対応していません。 事前に提供された技術的なアクセラレータと完全に互換性があります。

レプリケーション方法を選択する

最適なレプリケーション方法は、目的のユースケースや次のようなその他の考慮事項など、いくつかの要因によって異なります。

  • ビジネス要件: 主に標準のビジネスデータが必要で、クイック セットアップが必要な場合は、CDS ベースのレプリケーションが適しています。より特殊なデータが必要である場合や、テーブルを大幅にカスタマイズしている場合は、SLT ベースのレプリケーションを検討してください。

  • Cortex Framework の互換性。Cortex Framework を使用する場合は、SLT ベースのレプリケーションを使用します。

  • 技術的な専門知識: CDS ベースのレプリケーションは、SAP Basis またはデータ レプリケーションの専門知識を持つユーザーにとって操作が簡単です。

  • データの量と複雑さ: 数テラバイトのデータや複雑なテーブル関係の場合、SLT ベースのレプリケーションの方がスケーラブルです。

次のステップ