コンテンツに移動
データ分析

Data Fusion SAP コネクタ

2022年1月26日
Google Cloud Japan Team

※この投稿は米国時間 2022 年 1 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

企業では現在、データ分析と分析情報に基づいたアクションを求める声が高まっています。通常、これらを支える貴重なデータはミッション クリティカルな運用システムに保存されています。Google Cloud は、今日市場に出回っている数々のアプリケーションの中でも ERP ソフトウェアのリーディング プロバイダである SAP との統合を実現いたしました。この統合は、SAP データの価値を迅速かつ容易に引き出せるようにするものです。

このたび、Google Cloud ネイティブのデータ統合プラットフォームである Cloud Data Fusion に、SAP Business Suite、SAP ERP、S/4HANA からデータをシームレスに取得する新機能が加わりました。Cloud Data Fusion は、クラウド ネイティブなフルマネージド データ統合および取り込みサービスです。ETL デベロッパー、データ エンジニア、ビジネス アナリストの効率的な ETL / ELT パイプラインの構築、管理を支援します。これらのパイプラインにより、BigQuery 上のデータ ウェアハウス、データマート、データレイクや、Cloud SQL、Spanner などのシステム上のオペレーション レポート システムの構築が高速化されます。

本日、SAP データの価値を今までより簡単に引き出せる SAP ODP の一般提供、SAP SLT および SAP ODATA のプレビュー版のリリースを発表いたします。これにより、お客様がよりフレキシブルに SAP ECC と S/4HANA のデータをバッチまたはリアルタイムで活用することが可能になります。使い方は非常に簡単で、コードも不要です。このブログでは、SAP ODP、SLT コネクタ、SAP ODATA という 3 つのコネクタについて解説します。

SAP ODP(Open Data Provisioning)コネクタ GA

完全なデータまたは差分データを ERP エクストラクタ(データソース)を使用して SAP から BigQuery 等のシステムに転送

Cloud Data Fusion の Pipeline Studio で、SAP ソースのデータソースをデータのパイプラインに追加できます。必要に応じて、Wrangler などの変換オプションを追加します。次に、BigQuery や GCS などのシンクを追加します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Data_Fusion_Tu00WQl.max-1000x1000.jpg

SAP の接続オプションには、直接接続とロードバランサを介した接続の 2 種類があります。

データは、フル(全データ)と同期(前の実行に基づいて自動的に選択)という 2 つのモードで転送できます。

同期モードでは、前の実行のタイプと SAP で有効なステータスに基づき、フルと差分(増分)と復元(最後の実行からデータを復元する)のうち、どのモードを実行するかが自動的に判断されます。最初のパイプラインの実行時(ODP モード F)のすべてのデータを抽出して、その後のパイプラインの実行時(ODP モード D と R)のデータを変更します。

[検証] をクリックすると、プロパティを確認し、SAP に接続して、スキーマを取得します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Data_Fusion_vgXCrQR.max-2000x2000.jpg

SLT(SAP Landscape Transformation)コネクタ公開プレビュー版

SAP SLT(Landscape Transformation Server)は、SAP エコシステム内のデータの外部システムへのレプリケーション専用の SAP ソリューションです。

SAP SLT を使用した SAP からBigQuery へのデータのレプリケーション

SLT には構成上の前提条件がいくつかあります

  • SAP トランスポートのデプロイ

  • レプリケーション構成の設定

  • Google の ABAP SDK

CDF では、SAP.com から SAP JCo ライブラリをダウンロードするパスをユーザーが入力する必要があります

SLT から push されたデータのステージング エリアとして Google Cloud Storage が使用されるため、容量や割り当てを適切に設定するようにしてください。  

レプリケーション スタジオでは、SAP の SLT Replicator のソースをレプリケーション ジョブに追加できます。その後に、Big Query のターゲットを追加します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_Data_Fusion_8Dvq83o.max-500x500.jpg

SLT プラグインを設定するには、接続パラメータ(SAP のホスト、ユーザー、パスワード)および SLT GUID と 一括転送 ID を入力します。その後、レプリケートするテーブルを選択します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_Data_Fusion.max-2000x2000.jpg

SAP ODATA 公開プレビュー版

SAP の OData サービスを使用して SAP から BigQuery などのシステムにデータを転送

Cloud Data Fusion の Pipeline Studio では、SAP のソースの OData サービス 1 つをデータ パイプラインに追加できます。必要に応じて、Wrangler などの変換オプションを追加します。次に、BigQuery や GCS などのシンクを追加します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/5_Data_Fusion.max-1000x1000.jpg

SAP への接続は http や https を介して行います。認証には、SAP のユーザー名とパスワードを使用します。オプションとして、セキュリティの向上のため X.509 クライアント証明書を使用してもかまいません。  

ユーザーは、OData のベース URL、サービス名および抽出するエンティティを指定する必要があります。[検証] をクリックすると、プロパティを確認し、SAP に接続して、スキーマを取得します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/6_Data_Fusion.max-2000x2000.jpg

- プロダクト管理データ統合担当 Chaitanya (Chai) Pydimukkala

投稿先