BigQuery Connector for SAP プランニングガイド

このプランニングガイドでは、SAP LT Replication Server で BigQuery Connector for SAP のバージョン 2.9（最新）を使用して SAP データを BigQuery にレプリケーションする計画に必要な情報を SAP および Google Cloud の管理者に提供します。

このガイドの内容は次のとおりです。

ソフトウェア要件
セキュリティ
ネットワーキング
パフォーマンス計画
テーブルとフィールドのマッピングオプション
サポートライフサイクル

BigQuery での SAP データモデリング用のソリューションアクセラレータについては、Google Cloud Cortex Framework をご覧ください。

ソフトウェア要件

このセクションでは、BigQuery Connector for SAP のソフトウェア要件について説明します。

BigQuery Connector for SAP は、 Google Cloudやオンプレミス、あるいは AWS、Azure などのパブリッククラウドにある SAP LT Replication Server にインストールできます。

SAP ソフトウェアバージョンの要件

SAP LT Replication Server と SAP ソースシステムに必要なバージョンは、SAP LT Replication Server をスタンドアロンアーキテクチャの独自のサーバーにインストールしたか、組み込みアーキテクチャでソース ABAP アプリケーションシステムにインストールしたかによって異なります。

SAP ソフトウェアの要件は、データソースとして使用する SAP システム（SAP S/4HANA または SAP ECC）によっても異なります。

Google Cloud が BigQuery Connector for SAP をサポートしている SAP ソフトウェアバージョンを確認するには、ご使用の SAP ソースシステムに対応するタブを選択します。

S/4HANA

インストールアーキテクチャ	システム	サポート対象のバージョン	ユーザーインターフェース（UI）アドオン
スタンドアロン	ソースシステム	NetWeaver 7.5 以降または ABAP Platform の任意のバージョン。ソースシステムとターゲットシステムの DMIS バージョンに互換性があることを確認するには、SAP Note 2577774 をご覧ください。 SLT アドオン: DMIS 2011 SP15、DMIS 2018 SP00、DMIS 2020、または任意のバージョンの S4CORE。	SAP の推奨に従って、UI アドオンが SAP NetWeaver バージョンと互換性のある最新バージョンであることを確認します。 /UI2/CL_JSON: PL12 以降。 UI アドオンの必要な最小バージョンについては、SAP Note 22798102 - /UI2/CL_JSON corrections - PL12 の「サポートパッケージ」セクションをご覧ください。 UI アドオンと SAP NetWeaver の互換性については、以下をご覧ください。 UI アドオンのマスターガイドソフトウェアコンポーネント SAP_UI SAP Note 2217489 - Maintenance and Update Strategy for SAP Fiori Front-End Server SAP Note 2211016 - UI add-on 2.0 for SAP NetWeaver: support package stack mapping to SAP_UI 7.50 & UI5 / UI2 versions
SAP LT Replication Server システム	NetWeaver 7.0（EHP2 を使用）または ABAP Platform の任意のバージョン SLT アドオン: DMIS 2011 SP15 以降、DMIS 2018 SP00 以降、または DMIS 2020 SP00 以降。
埋め込み	ソースシステム	NetWeaver 7.5 以降または ABAP Platform の任意のバージョン。 SLT アドオン: DMIS 2011 SP15 以降、DMIS 2018 SP00 以降、DMIS 2020 以降、または任意のバージョンの S4CORE。

インストールアーキテクチャ

システム

サポート対象のバージョン

ユーザーインターフェース（UI）アドオン

スタンドアロン

ソースシステム

NetWeaver 7.5 以降または ABAP Platform の任意のバージョン。
ソースシステムとターゲットシステムの DMIS バージョンに互換性があることを確認するには、SAP Note 2577774 をご覧ください。
SLT アドオン: DMIS 2011 SP15、DMIS 2018 SP00、DMIS 2020、または任意のバージョンの S4CORE。

SAP の推奨に従って、UI アドオンが SAP NetWeaver バージョンと互換性のある最新バージョンであることを確認します。

/UI2/CL_JSON: PL12 以降。

UI アドオンの必要な最小バージョンについては、SAP Note 22798102 - /UI2/CL_JSON corrections - PL12 の「サポートパッケージ」セクションをご覧ください。

UI アドオンと SAP NetWeaver の互換性については、以下をご覧ください。

SAP LT Replication Server システム

NetWeaver 7.0（EHP2 を使用）または ABAP Platform の任意のバージョン
SLT アドオン: DMIS 2011 SP15 以降、DMIS 2018 SP00 以降、または DMIS 2020 SP00 以降。

埋め込み

ソースシステム

NetWeaver 7.5 以降または ABAP Platform の任意のバージョン。
SLT アドオン: DMIS 2011 SP15 以降、DMIS 2018 SP00 以降、DMIS 2020 以降、または任意のバージョンの S4CORE。

ECC

インストールアーキテクチャ	システム	サポート対象のバージョン	ユーザーインターフェース（UI）アドオン
スタンドアロン	ソースシステム	NetWeaver 7.0（EHP2 を使用）以降ソースシステムとターゲットシステムの DMIS バージョンに互換性があることを確認するには、SAP Note 2577774 をご覧ください。 DMIS バージョンに互換性がある場合は、古いバージョンの ECC を使用できます。 SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。	SAP の推奨に従って、UI アドオンが SAP NetWeaver バージョンと互換性のある最新バージョンであることを確認します。 /UI2/CL_JSON: PL12 以降。 UI アドオンの必要な最小バージョンについては、SAP Note 22798102 - /UI2/CL_JSON corrections - PL12 の「サポートパッケージ」セクションをご覧ください。 UI アドオンと SAP NetWeaver の互換性については、以下をご覧ください。 UI アドオンのマスターガイドソフトウェアコンポーネント SAP_UI SAP Note 2217489 - Maintenance and Update Strategy for SAP Fiori Front-End Server SAP Note 2211016 - UI add-on 2.0 for SAP NetWeaver: support package stack mapping to SAP_UI 7.50 & UI5 / UI2 versions
SAP LT Replication Server システム	NetWeaver 7.0（EHP2 を使用）以降 SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。
埋め込み	ソースシステム	NetWeaver 7.0（EHP2 を使用）以降 SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。

インストールアーキテクチャ

システム

サポート対象のバージョン

ユーザーインターフェース（UI）アドオン

スタンドアロン

ソースシステム

NetWeaver 7.0（EHP2 を使用）以降
ソースシステムとターゲットシステムの DMIS バージョンに互換性があることを確認するには、SAP Note 2577774 をご覧ください。

DMIS バージョンに互換性がある場合は、古いバージョンの ECC を使用できます。
SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。

SAP の推奨に従って、UI アドオンが SAP NetWeaver バージョンと互換性のある最新バージョンであることを確認します。

/UI2/CL_JSON: PL12 以降。

UI アドオンの必要な最小バージョンについては、SAP Note 22798102 - /UI2/CL_JSON corrections - PL12 の「サポートパッケージ」セクションをご覧ください。

UI アドオンと SAP NetWeaver の互換性については、以下をご覧ください。

SAP LT Replication Server システム

NetWeaver 7.0（EHP2 を使用）以降
SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。

埋め込み

ソースシステム

NetWeaver 7.0（EHP2 を使用）以降
SLT アドオン: DMIS 2011 SP15 以降、または DMIS 2018 SP00 以降。

オペレーティングシステムの要件

BigQuery Connector for SAP は、SAP LT Replication Server でサポートされている任意のオペレーティングシステムをサポートします。

SAP LT Replication Server がサポートするオペレーティングシステムについては、SAP のプロダクトの提供状況に関する表をご覧ください。

Cloud 請求先アカウントの要件

BigQuery Connector for SAP は無料で提供されていますが、インストールパッケージを受け取るには Cloud 請求先アカウントが必要です。

スケーラビリティ

BigQuery Connector for SAP は、数百万件の差分処理を必要とする数十億個のデータレコードなどの大量のデータについて、大規模なデータ抽出処理を並列処理するために SAP LT Replication Server のスケーリング機能とパーティショニング機能を使用します。詳しくは、SAP ヘルプポータルで SAP LT Replication Server のご利用バージョンに関するサイジングガイドをご覧ください。

Google Cloud 側では、レプリケーションパスに応じて、BigQuery Connector for SAP が異なる Google Cloud サービスを使用してデータ読み込みをスケーリングします。

Pub/Sub を介した CDC レプリケーションの場合、BigQuery Connector for SAP は Pub/Sub API と Storage Write API を使用します。
ストリーミングデータレプリケーションの場合、BigQuery Connector for SAP は BigQuery ストリーミング API を使用します。

サポートされているレプリケーションソース

BigQuery Connector for SAP は、SAP LT Replication Server でサポートされているアプリケーションソースとデータベースソースシステムのほとんどをサポートします。

サポートされている SAP アプリケーションソース

SAP LT Replication Server がサポートする SAP アプリケーションソースからデータを複製できます。BigQuery Connector for SAP では、サポートされているエンタープライズアプリケーションのメジャーバージョンをデータソースとしてサポートします。また、古いレガシーアプリケーションもサポートしています。以下に、サポートされている SAP アプリケーションの一部を示します。

SAP Business Suite 7
S/4HANA
SAP NetWeaver で動作する SAP アプリケーション

SAP では、SAP Business Warehouse からデータを複製する際の SAP LT Replication Server の使用を推奨していません。 SAP の詳細については、SAP Note 2525755 をご覧ください。

S/4HANA Cloud、SAP Ariba、SAP SuccessFactors などの SAP Cloud アプリケーションはサポートされていません。

サポートされるデータソース

複製できるのは、透過テーブルまたはクラスタテーブルのみです。

BigQuery Connector for SAP は、SAP Core Data Services（CDS）ビューのレプリケーションをサポートしていません。

情報設計ツールでは、SAP BusinessObjects Business Intelligence 4.3 から BigQuery をデータソースとしてサポートしています。BigQuery に保存されたデータは、SAP BusinessObjects Web Intelligence や SAP Crystal Reports for Enterprise などの SAP BusinessObjects レポートツールからクエリできます。

互換性の詳細については、SAP Note 2750723 - Support of Google BigQuery in SAP BI platform products をご覧ください。

セキュリティ

SAP LT Replication Server から BigQuery へのデータレプリケーションに対するセキュリティを実装する場合は、SAP LT Replication Server、SAP LT Replication Server ホストオペレーティングシステム、Google Cloudにセキュリティ管理を実装する必要があります。

BigQuery Connector for SAP と BigQuery 間の通信に、BigQuery Connector for SAP はエンドツーエンドの HTTPS 通信と SSL を使用します。

SAP のセキュリティ

SAP LT Replication Server で BigQuery Connector for SAP を構成して操作できるユーザーを制御するには、標準の SAP ロールベースの認可を使用します。

BigQuery Connector for SAP は、トランスポートのインストールの一部として、認可オブジェクト ZGOOG_MTID を備えています。

BigQuery Connector for SAP を使用するデータレプリケーションジョブを構成して実行するには、SAP LT Replication Server 内で管理者権限を持つロールを定義します。詳細については、BigQuery Connector for SAP のロールと認可を作成するをご覧ください。

たとえば、BigQuery へのデータレプリケーションを構成して運用するために必要なすべての SAP 認可と ZGOOG_MTID 認可を含む ZGOOGLE_BIGQUERY_ADMIN というロールを定義するには、BigQuery Connector for SAP を使用します。

ロールと認可に関する SAP による詳細な情報については、SAP ヘルプポータルにある SAP LT Replication Server バージョンのセキュリティガイドをご覧ください。

Google Cloud のセキュリティ

Google Cloud に BigQuery Connector for SAP のセキュリティを実装すると、次のセキュリティ管理を行うことができます。

Identity and Access Management（IAM）の権限、ロール、サービスアカウント、キー。
データセットレベルまたはテーブルレベルで設定される BigQuery のコントロール。
BigQuery など、API ベースのサービス用の Virtual Private Cloud（VPC）Service Controls。
VPC ネットワーク全体で BigQuery などのサービスのプライベート利用を可能にする Private Service Connect エンドポイント。

Google Cloud Identity and Access Management

BigQuery Connector for SAP の認証と認可には、BigQuery データセットを含むGoogle Cloud プロジェクトで IAM サービスアカウントが必要です。

Google Cloud リソースの操作を承認するには、BigQuery サービスと Pub/Sub サービスを操作する権限を持つサービスアカウントにロールを付与します。

ストリーミングデータレプリケーション（挿入専用）の場合、BigQuery Connector for SAP が BigQuery にアクセスするために必要な権限は、次の IAM ロールに含まれています。

変更データキャプチャ（CDC）レプリケーションの場合、BigQuery Connector for SAP が Pub/Sub と BigQuery にアクセスするために必要な権限は、次の IAM ロールに含まれています。

SAP LT Replication Server が Compute Engine VM で実行されている場合は、ホスト VM のサービスアカウントにサービスアカウントトークン作成者のロールも付与する必要があります。

SAP LT Replication Server がオンプレミスまたは別のクラウドプラットフォームで実行されている場合は、サービスアカウントの作成に加えて、BigQuery Connector for SAP 用のサービスアカウントキーも作成する必要があります。SAP 管理者が SAP LT Replication Server ホストにキーをインストールします。BigQuery Connector for SAP が Pub/Sub または BigQuery に接続すると、SAP LT Replication Server はサービスアカウントキーを使用してGoogle Cloudで認証します。

SAP LT Replication Server が Google Cloudで実行されている場合、サービスアカウントキーは必要ありません。

注: サービスアカウントキーが正しく管理されていない場合は、セキュリティリスクが発生します。可能であれば、サービスアカウントキーよりも安全な代替手段を選択してください。サービスアカウントキーで認証する必要がある場合は、秘密鍵のセキュリティと、サービスアカウントキーを管理するためのベストプラクティスで説明されているその他の操作は、ユーザーの責任で実施してください。サービスアカウントキーを作成できない場合は、組織でサービスアカウントキーの作成が無効になっている可能性があります。詳細については、デフォルトで安全な組織リソースの管理をご覧ください。

外部ソースからサービスアカウントキーを取得した場合は、使用前に検証する必要があります。詳細については、外部ソースの認証情報のセキュリティ要件をご覧ください。

IAM、サービスアカウント、ロール、権限の詳細については、以下をご覧ください。

BigQuery のデータセットとテーブルのアクセス制御

IAM のほかに、BigQuery を使用してアクセスを制御することもできます。BigQuery Connector for SAP では、データセットとテーブルに対してアクセス制御を設定できます。

詳細情報:

VPC Service Controls

Google Cloudでは、VPC ファイアウォールルールは API ベースの BigQuery の操作に適用されません。トラフィックを制限するには、代わりに Virtual Private Cloud（VPC）Service Control を使用します。

SAP ワークロードが Google Cloudで実行されている場合は、サービス境界を定義することで VPC Service Controls を実装できます。詳細については、サービス境界をご覧ください。

SAP ワークロードが Google Cloudで実行されていない場合は、オンプレミスホスト用のプライベート Google アクセスの設定で VPC Service Controls を実装できます。

BigQuery のネットワークセキュリティの詳細については、ネットワークセキュリティをご覧ください。

Private Service Connect エンドポイント

VPC ネットワークに、BigQuery などの Google マネージドサービスのプライベート利用を可能にするエンドポイントを設定する場合は、Private Service Connect を使用できます。

Private Service Connect を使用すると、VPC CIDR 範囲の内部 IP アドレスを使用して Google API とサービスにアクセスできるプライベートエンドポイントを作成できます。Private Service Connect を使用して、BigQuery ストリーミング API にカスタム DNS 名を作成することもできます。詳細については、Private Service Connect をご覧ください。

Google Cloudの外部のホストで実行されている BigQuery Connector for SAP の場合、Private Service Connect はサポートされていません。

Google Cloud のセキュリティに関する詳細

セキュリティアカウント、ロール、権限の詳細については、以下をご覧ください。

ネットワーキング

BigQuery へのレプリケーションのネットワークパスを計画する際は、次の点を考慮してください。

帯域幅
レイテンシと SAP LT Replication Server ホストのリソース消費に対する影響
データ量と、既存のネットワーク負荷への影響
SAP ワークロードが Google Cloudで実行されていない場合、使用する接続タイプは Cloud Interconnect または Cloud VPN です。

Google Cloudへの接続

SAP システムが Google Cloud で実行されておらず、SAP システムから Google Cloudへの接続がまだ確立されていない場合は、接続を確立し、 Google Cloud APIs へのプライベートアクセスを構成する必要があります。

Cloud Interconnect または Cloud VPN を使用して Google Cloud との接続を確立できます。

Cloud Interconnect は通常、Cloud VPN よりも高帯域幅、低レイテンシ、ネットワーク競合の低減を実現します。大容量でパフォーマンス重視のレプリケーションジョブの場合、 Google Cloudでは BigQuery Connector for SAP 用の Cloud Interconnect をおすすめします。

Cloud VPN では、レプリケーションデータは公共のインターネット上で転送されるため、ネットワーク競合は予測不可能であり、レイテンシは通常高くなります。

いずれの接続オプションでも、接続でサポートされるすべてのトラフィックを確認する必要があります。接続の帯域幅とネットワーク速度が、レプリケーションジョブやその他のワークロードに悪影響を与えているかどうかを確認します。

接続速度が遅い場合は、リソースジョブの完了にかかる時間が延長されるため、SAP ソースサーバーと SAP LT Replication Server ホストの両方でリソースの消費が増加する可能性があります。これにより、レプリケーションに必要なリソースがより長期間にわたり結合されます。

接続オプションの詳細については、以下をご覧ください。

プロキシサーバーを使用して HTTP リクエストを Google Cloudに送信するには、トランザクション SM59 で定義された RFC 宛先を使用することをおすすめします。

RFC 宛先

BigQuery Connector for SAP のトランスポートファイルには、トランザクション SM59 内の次のサンプル RFC 宛先が含まれています。これらの RFC 宛先は外部サーバー（タイプ G）への HTTP 接続であり、それぞれのサービスの公開 API エンドポイントに接続します。

サンプル RFC 宛先の名前	ターゲットホスト（API エンドポイント）	注
`GOOG_BIGQUERY`	`https://bigquery.googleapis.com`	この RFC 宛先は、BigQuery API をターゲットとしています。
`GOOG_PUBSUB`	`https://pubsub.googleapis.com`	この RFC 宛先は、Pub/Sub API をターゲットとしています。
`GOOG_IAMCREDENTIALS`	`https://iamcredentials.googleapis.com`	この RFC 宛先は、IAM API をターゲットとしています。
`GOOG_OAUTH2_TOKEN`	`https://googleapis.com/oauth2`	この RFC 宛先は、OAuth 2.0 ベースの認証用の Google Cloud エンドポイントをターゲットとしています。これは、 Google Cloud の外部で実行されている SAP ワークロードで、JSON Web Token（JWT）を使用して Google Cloud の認証を行う場合にのみ使用します。

RFC 宛先を使用して Google Cloud に接続すると、次のような利点があります。

SAP 環境でプロキシサーバーを使用していて、その同じプロキシを使用して Google Cloudに HTTP リクエストを送信する場合は、RFC 宛先でプロキシサーバーを構成できます。
Private Service Connect エンドポイントを介して Google Cloud APIs とサービスへのアクセスを有効にする場合、これらのエンドポイントをGoogle Cloud プロジェクトに作成し、RFC 宛先でエンドポイントを指定できます。
HTTP 圧縮を使用できます。SAP ソースシステムと BigQuery データセットが異なる Compute Engine リージョンにあるクロスリージョンレプリケーションの場合、Google Cloud では、HTTP 圧縮の使用を推奨しています。

RFC 宛先を使用して Google Cloud APIs またはサービスに接続するには、RFC 宛先を /GOOG/CLIENT_KEY テーブルにマッピングするエントリを /GOOG/SERVIC_MAP テーブル内に作成する必要があります。構成手順については、ご使用のシナリオに対応する BigQuery Connector for SAP のインストールと構成のガイドをご覧ください。

HTTP 圧縮

RFC 宛先を使用して、BigQuery Connector for SAP と Google Cloud APIs の間の接続を設定すると、圧縮オプションを使用して HTTP リクエスト本文を圧縮できます。HTTP 圧縮は、HTTP 1.1 を使用するように RFC 宛先を構成する場合にのみ使用できます。

本番環境で HTTP 圧縮を有効にする前に、テスト環境で HTTP 圧縮に影響するプロファイルパラメータを分析します。SAP の詳細については、SAP Note 1037677 - HTTP compression compresses certain documents only をご覧ください。

帯域幅

SAP LT レプリケーションサーバーとGoogle Cloud 間のネットワーク接続において、必要な速度でデータ量を処理できる十分な帯域幅があることを確認してください。

ネットワーク接続が遅いと、データレプリケーションのレイテンシが増加し、レプリケーションによってソース SAP システムで使用されるリソースが増加します。

インストールを効率的に行えるよう、 Google Cloud では Cloud Interconnect 接続をおすすめします。Cloud VPN も使用できます。

レイテンシ

ネットワーク接続のレイテンシを短縮するには、SAP LT Replication Server システムと SAP ソースシステムのできるだけ近くにターゲットの BigQuery データセットを作成します。ソース SAP システムが Google Cloudで実行されている場合は、ソース SAP システムと同じ Google Cloud リージョンに BigQuery データセットを作成します。

本番環境に移行する前にレイテンシをテストします。

ネットワークパフォーマンスの詳細については、ネットワーク接続のパフォーマンスをご覧ください。

ネットワークアクセス制御

SAP LT Replication Server と Google Cloud間の接続の両側にネットワークアクセス制御を実装できます。

Google Cloud のネットワークアクセス制御

BigQuery Connector for SAP は、 Google CloudVPC ファイアウォールルールの対象ではない API エンドポイントを介して BigQuery と通信します。

代わりに、VPC Service Controls を使用してトラフィックを制限します。

BigQuery のネットワークセキュリティの詳細については、ネットワークセキュリティをご覧ください。

SAP LT Replication Server ホストネットワークのアクセス制御

SAP LT Replication Server ホストでは、ファイアウォールまたはプロキシがサーバーから BigQuery API エンドポイントと Pub/Sub API エンドポイントへの下り（外向き）トラフィックを許可するように設定する必要があります。具体的には、SAP LT Replication Server が次の Google Cloud APIs にアクセスできることを確認します。

https://bigquery.googleapis.com
https://pubsub.googleapis.com
https://iamcredentials.googleapis.com

BigQuery および Pub/Sub の API にアクセスするために Private Service Connect エンドポイントを使用したい場合は、テーブル /GOOG/SERVIC_MAP にそのエンドポイントを設定する必要があります。

パフォーマンス計画

SAP LT Replication Server と BigQuery の間の初期読み込みとレプリケーションジョブのパフォーマンスは、レプリケーションパスのさまざまなポイントで複数の要因の影響を受けます。

ただし、SAP LT Replication Server と BigQuery データセット間の距離や Google Cloud接続の帯域幅などの基本的な要因は、他の要因よりもパフォーマンスに大きな影響を与えます。

パフォーマンスに関する一般的なベストプラクティス

最高のパフォーマンスを得るには、SAP LT Replication Server の構成で次の推奨事項を行います。

SAP ソースシステムや SAP LT Replication Server などの SAP ワークロードを Google Cloudで実行します。
SAP ワークロードが Google Cloud上にある場合は、SAP ワークロードと同じリージョンに BigQuery データセットを作成します。
Google Cloudで SAP ワークロードを実行できない場合:
- SAP ワークロードに最も近い Google Cloudリージョンに BigQuery データセットを作成します。
- Cloud Interconnect を使用して Google Cloud に接続します。
リソースの競合を回避するには、SAP ソースシステムと SAP LT Replication Server の両方に別々の専用ホストを使用します。
SAP ヘルプポータルで SAP LT Replication Server のバージョンに応じたサイジングガイドを参照し、ワークロードに最適な SAP LT Replication Server システムのサイズを決定します。
次の SAP LT Replication Server レプリケーション設定を使用します。
- 並列ジョブ。
- 読み取りタイプ 1（可能な場合）。詳細については、パフォーマンスと LTRS の詳細レプリケーションの設定をご覧ください。
以下の内容に基づき BigQuery Connector for SAP を構成します。
- デフォルトのレコード圧縮。
- デフォルトのチャンクサイズ。
フィールドを BigQuery テーブルにマッピングする場合、可能であればカスタム名は使用しないでください。

詳細情報:

SAP LT Replication Server のパフォーマンスに関する考慮事項
ネットワーク接続のパフォーマンス
データの転送
レコードの圧縮

パフォーマンスに影響を与える可能性のあるその他の特性

パフォーマンスには、構成やデータの多くの特性が影響する可能性があります。これらの特性の一部は変更できない場合があります。主な特性は次のとおりです。

ソースサーバー:
- CPU の数。
- メモリの量。
- 使用されているデータベース（SAP HANA、SAP ASE、IBM Db2 など）。
- ソーステーブルの列数。
- 各レコードが保持するデータ量。
- テーブルのメタデータ（フィールド名の長さなど）。
- ダイアログの作業プロセスの数。
SAP LT Replication Server:
- CPU の数。
- メモリの量。
- ホストが実行している他のワークロード。
- SAP のダイアログとバックグラウンド作業プロセス。
- SAP LT Replication Server のインストールアーキテクチャのタイプ。詳細については、SAP LT Replication Server のスタンドアロン（推奨）または組み込みインストールをご覧ください。
- SAP LT Replication Server システムで実行されているバックグラウンドジョブの数。
- LTRC トランザクションの [Administration] タブで一括転送に割り当てられるバックグラウンドジョブの数。
- LTRS トランザクションパフォーマンスの設定（読み取りタイプや部分サイズなど）。
BigQuery レプリケーション構成（トランザクション /GOOG/SLT_SETTINGS）内:
- ターゲットフィールドにカスタム名が指定されているかどうか。ターゲットの BigQuery フィールド名の処理は、パフォーマンスにわずかに影響する可能性があります。
- レコード圧縮を有効にするかどうか。
- チャンクサイズ。送信された HTTP リクエストの合計数に影響する可能性があります。

SAP LT Replication Server のパフォーマンスに関する考慮事項

以降のセクションでは、SAP LT Replication Server 構成に関連するパフォーマンスオプションについて説明します。

パフォーマンスと SAP LT Replication Server のインストールアーキテクチャ

スタンドアロンアーキテクチャでは、SAP LT Replication Server が専用のサーバーにインストールされているため、通常は SAP LT Replication Server がソースシステムと同じサーバーにインストールされている組み込みアーキテクチャよりもパフォーマンスが向上します。

組み込みアーキテクチャでは、SAP LT Replication Server は SAP ソースシステムとサーバーリソースを共有する必要があります。

スタンドアロンアーキテクチャであっても、ホストの CPU とメモリ、サーバーで実行されている他のワークロードによって、SAP LT Replication Server インスタンスのパフォーマンスに対する影響が生じる可能性があります。

パフォーマンスと `LTRS` の高度なレプリケーション設定

初期読み込みとレプリケーションのパフォーマンスは、LTRS トランザクションのソーステーブルに指定した高度なレプリケーション設定の影響を受けます。

パフォーマンス調整のガイダンス、特に大量の初期読み込みまたはレプリケーションの最適化については、SAP ヘルプポータルにある SAP LT Replication Server パフォーマンス最適化ガイドをご覧ください。

Google Cloud では、トランザクション LTRS の [高度なレプリケーション設定] > [全般的なパフォーマンス] のセクションで、次の仕様を指定することをおすすめします。

ほとんどのテーブルタイプでは、初期読み込みの読み取りタイプとして [1 Range Calculation] を指定します。[1 Range Calculation] に対してテーブルが大きすぎる場合は、読み取りタイプ 5 を指定します。

レプリケーションの場合は、[Active Settings] で次のように設定します。

レプリケーションを高速で行うには、[Auto Ranges] を指定します。
レプリケーションの信頼性を高めるには、[No Ranges] を指定します。

次の表に、一般的なシナリオの設定を示します。

テーブルタイプ	推奨される読み取りタイプ
透過（小～中）	読み取りタイプ 1 - 範囲の計算
透過（大）	読み取りタイプ 1 が機能しない場合にのみ、読み取りタイプ 5 - 範囲計算
クラスタテーブル	読み取りタイプ 4 - 送信者キュー

ネットワーク接続のパフォーマンス

SAP LT Replication Server システムと Google Cloud 間の接続の帯域幅とレイテンシは、BigQuery へのレプリケーションの全体的なパフォーマンスに影響を与える可能性があります。

この影響は、レプリケーションの速度だけでなく、SAP LT Replication Server とソースシステムで使用されるリソースの量にも影響します。これは、BigQuery からレプリケーションの確認を受け取るのに時間がかかるため、より長い SAP LT Replication Server とソースシステムがホストリソースを保持するためです。

SAP ワークロードがオンプレミスまたは別のクラウドプロバイダで実行されている場合、Google Cloud では Cloud Interconnect 接続を使用することをおすすめします。これにより、公共のインターネット上のトラフィックと競合せずに高帯域幅で低レイテンシを実現できます。

Cloud VPN を使用して Google Cloud と BigQuery に接続できますが、VPN 接続では、レプリケーションが一般的なインターネットトラフィックと競合する状態を回避できません。

SAP ワークロードが Google Cloudで実行されている場合、 Google Cloudでは SAP LT Replication Server と BigQuery データセットを同じリージョンに配置することをおすすめします。通常、SAP LT Replication Server と BigQuery が異なるリージョンにあると、レイテンシが大きくなり、パフォーマンスが低下します。リージョン選択の詳細については、リージョンとゾーンの選択をご覧ください。

データの転送

一般に、HTTP リクエストの総数とそれに関連する処理のオーバーヘッドを削減するため、1 回の HTTP リクエストでできるだけ多くのデータを送信します。

ただし場合によっては、特定のテーブル内のレコードサイズが大きいため、あるいは Pub/Sub や BigQuery の割り当て上限やその他の制限に達しているために、送信するデータ量を減らさなければならないことがあり得ます。

1 回のリクエストで送信されるデータの量は次の方法で制御できます。

SAP LT Replication Server が BigQuery Connector for SAP に送信するデータの量（部分サイズ）を調整します。
BigQuery Connector for SAP が BigQuery に送信するデータの量（チャンクサイズ）を調整します。
BigQuery プロジェクトでストリーミング挿入の割り当てを調整します。

SAP LT Replication Server によって送信されるデータの量を調整する

SAP LT Replication Server は、ソースシステムから BigQuery Connector for SAP に部分としてレコードを送信します。処理が完了するまで、各部分は、サーバーリソースを消費する個別の読み込みジョブまたはレプリケーションジョブとして処理されます。

通常、SAP LT Replication Server の部分サイズを増やすと、SAP LT Replication Server のプロセス数だけでなく、そのプロセスに関連するオーバーヘッドも少なくなります。

部分サイズとチャンクサイズ

SAP LT Replication Server の部分は、バイト単位、またはバイトとレコードの積で表されます。BigQuery Connector for SAP のチャンクサイズは、格納できるレコード数によって異なります。チャンクのバイトサイズは、レコード内のフィールド数や各レコードが保持するデータ量など、いくつかの要因によって変化します。

SAP LT Replication Server の部分サイズが BigQuery Connector for SAP のチャンクサイズよりも大きい場合、BigQuery Connector for SAP は、対象部分からすべてのレコードが送信されるまで、各部分の複数のチャンクを送信します。

部分サイズがチャンクサイズよりも小さい場合、BigQuery Connector for SAP は部分ごとに 1 つのチャンクのみを送信します。各チャンクには、BigQuery Connector for SAP に設定されたチャンクサイズに関係なく、各部分で送信されたレコード数のみが含まれます。

理想的には、SAP LT Replication Server で、BigQuery Connector for SAP が各 HTTP リクエストのバイト数の上限（Pub/Sub や BigQuery の上限）を超えることなく、可能な限り最大のチャンクを作成できるように、部分サイズを設定します。

チャンクサイズの指定に関する詳細なガイダンスについては、BigQuery Connector for SAP のチャンクサイズをご覧ください。

SAP LT Replication Server の部分サイズ

SAP LT Replication Server が使用するデフォルトの部分サイズを変更するには、トランザクション LTRS を実行して、[Performance Options] の下にある [Advanced Replication Settings] で、[Package Size] フィールドの値を調整します。

詳しくは、SAP ヘルプポータルの SAP LT Replication Server パフォーマンス最適化ガイドをご覧ください。

BigQuery Connector for SAP のチャンクサイズ

BigQuery Connector for SAP は、データをレコードのチャンクとして BigQuery に送信します。

Pub/Sub を介した CDC レプリケーションでは、BigQuery Connector for SAP のデフォルトのチャンクサイズ（1,000 レコード）を使用することをおすすめします。これは、Pub/Sub で許可されるレコードの最大数です。

ストリーミングデータレプリケーションでは、BigQuery Connector for SAP のデフォルトのチャンクサイズ（10,000 レコード）を使用することをおすすめします。ソーステーブルのレコードに含まれるフィールドが非常に少ないか、フィールドに含まれるデータサイズが非常に小さい場合は、BigQuery で使用できる最大サイズ（50,000 レコード）までチャンクサイズを拡大できます。

特定のチャンク内のレコード数が、HTTP リクエストのバイトサイズについて許可されている上限を超えるバイトサイズに解決される場合は、quotaExceeded エラーまたは invalid エラーが返されます。

これは、ソーステーブルのレコードに多数のフィールドが含まれているか、フィールド内に大量のデータが含まれている場合に発生します。

チャンクサイズに関連するエラーが発生した場合は、そのテーブルの大量転送構成で指定されているチャンクサイズを縮小してみてください。また、そのテーブルの動的チャンクサイズを有効にして、チャンクサイズを自動的に調整することもできます。詳細については、動的チャンクサイズをご覧ください。

動的チャンクサイズを有効にしていない場合は、MSEG、ACDOCA、MATDOC などの SAP ソーステーブルで、フィールド数が多くサイズの大きいレコードが作成される可能性があるため、チャンクサイズを小さく指定する必要が生じる場合があります。

チャンクサイズは、/GOOG/SLT_SETTINGS トランザクションを実行することで指定できます。チャンクサイズは、テーブル属性画面の [Chunk Size] フィールドで指定します。

チャンクサイズの指定について詳しくは、以下をご覧ください。

Pub/Sub を介した CDC レプリケーションについては、テーブル作成とその他の一般的な属性を指定するをご覧ください。
ストリーミングデータレプリケーションについては、テーブル作成とその他の一般的な属性を指定するをご覧ください。

BigQuery エラーメッセージの詳細については、エラーメッセージをご覧ください。

部分の送信に関連する処理オーバーヘッド

送信される各部分によって次のようなアクションがトリガーされ、それぞれが処理オーバーヘッドまたはリソース消費の原因となります。

ソースシステムのロギングテーブルで変更されたレコードのコレクションが 1 つの部分として SAP LT Replication Server に送信されます。変更されたレコードは、まだロギングテーブルから削除されません。
SAP LT Replication Server は、 Google Cloudから新しいアクセストークンをリクエストします。
BigQuery Connector for SAP は、ターゲットテーブルの構造を確認するために HTTP リクエストを Google Cloudに送信します。
BigQuery Connector for SAP は、受信したすべてのレコードを 1 回で送信するために必要なチャンク数で、レコードを Google Cloudに送信します。各チャンクは個別の HTTP リクエストで送信されます。
Google Cloud は受信した各チャンクを処理します。
チャンクごとに HTTP OK ステータスコードが SAP LT Replication Server に返されます。
Google Cloud がすべてのレコードを受信すると、SAP LT Replication Server は送信されたレコードをロギングテーブルから削除します。これにより、最終的にソースシステムのリソースが解放されます。

SAP LT Replication Server のパフォーマンスに関する部分と構成の詳細については、SAP ヘルプポータルの SAP LT Replication Server パフォーマンス最適化ガイドをご覧ください。

BigQuery の割り当て

プロジェクトで有効になっている BigQuery ストリーミング API の割り当ては、時間の経過に合わせて 1 つの HTTP リクエストで BigQuery にストリーミングできるデータ量を制限します。

たとえば、BigQuery では次のような指標に上限が設定されます。

プロジェクトごとに 1 秒間に送信可能なバイト数。
1 回の HTTP リクエストで送信可能なレコードまたは行の最大数。
送信可能な HTTP リクエストの最大サイズ。

ストリーミング挿入では、BigQuery は HTTP リクエストのサイズを 10 MB に固定し、1 回の HTTP リクエストで送信できるレコード数を 50,000 に固定します。

ほとんどの場合、割り当ての変更はできますが、上限の変更はできません。

プロジェクトで有効な割り当ては、Google Cloud コンソールの [割り当て] ページで確認して変更できます。

ストリーミング挿入の BigQuery の割り当てと上限の詳細については、以下をご覧ください。

Pub/Sub 割り当て

プロジェクトで有効になっている Pub/Sub API の割り当ては、時間の経過に合わせて 1 つの HTTP リクエストで BigQuery にストリーミングできるデータ量を制限します。

たとえば、Pub/Sub では次のような指標に上限が設定されます。

プロジェクトごとに 1 秒間に送信可能なバイト数。
1 回の HTTP リクエストで送信可能なレコードまたは行の最大数。
送信可能な HTTP リクエストの最大サイズ。

CDC データの場合、Pub/Sub は HTTP リクエストのサイズを 10 MB に固定し、1 回の HTTP リクエストで送信できるレコード数を 1,000 に固定します。

ほとんどの場合、割り当ての変更はできますが、上限の変更はできません。

プロジェクトで有効な割り当ては、Google Cloud コンソールの [割り当て] ページで確認して変更できます。

Pub/Sub の割り当てとリソースの上限の詳細については、以下をご覧ください。

レコードの圧縮

Pub/Sub を介した CDC レプリケーションは、レコード圧縮機能には対応していません。

ストリーミングデータのレプリケーションにおいて、BigQuery Connector for SAP はデフォルトで、BigQuery に送信するレコードを圧縮することでレプリケーションのパフォーマンスを高めます。BigQuery Connector for SAP バージョン 2.8 以降では、レコード圧縮オプションをテーブルレベルとフィールドレベルで使用できます。

テーブルレベルでレコード圧縮が有効な場合（デフォルト設定）、BigQuery Connector for SAP は、ソースレコード内の空のフィールドを BigQuery に送信されるレコードから除外します。レコードが BigQuery に挿入されると、送信データから除外されたフィールドは、BigQuery のターゲットテーブル内で null を使用して初期化されます。

ただし、テーブルレベルでレコード圧縮を使用しつつも、一部の空のフィールドを初期値のままで BigQuery に複製する必要がある場合は、それらの特定のフィールドのレコード圧縮設定を変更できます。つまり、指定したフィールドの空の値は送信データから除外されず、ソーステーブルで初期化された値が保持されます。

レコード圧縮の動作を制御するには、非圧縮送信フラグ設定を使用します。このフラグはテーブルレベルとフィールドレベルで使用可能です。次の表に、レコード圧縮の動作を示します。

テーブルレベルでの非圧縮送信フラグ	フィールドレベルでの非圧縮送信フラグ	レコード圧縮の動作
○	×	すべてのフィールドは圧縮されずに送信されます。
○	○	すべてのフィールドは圧縮されずに送信されます。
×	○	フィールドレベルで選択されたフィールドのみが圧縮されずに送信されます。
×	×	すべてのフィールドが圧縮されて送信されます。

非圧縮データがレプリケーションのために送信される場合、日付フィールドとタイムスタンプフィールドを除き、空のフィールドには、ソーステーブル内で初期化に使用された値が保持されます。日付フィールドとタイムスタンプフィールドの初期化された値は、次の値を受け取ります。

日付フィールドの初期化値: DATE 1970-01-01
タイムスタンプフィールドの初期化値: TIMESTAMP 1970-01-01 00:00:00 UTC

次のスクリーンショットは、レコード圧縮の動作の例を示しています。

行 1: すべてのフィールドが圧縮されていません。非圧縮送信フラグがテーブルレベルで選択されています。
行 2: すべてのフィールドが圧縮されています。非圧縮送信フラグがテーブルレベルでクリアされています。
行 3: int2_value、curr_value_154、currency、float_value、lang_value の各フィールドは圧縮されていません。これらのフィールドでは、フィールドレベルで非圧縮送信フラグが選択されています。

図は前述のテキストで説明されています。

パフォーマンスを向上させるには、テーブルレベルで非圧縮送信フラグを選択してレコード圧縮を無効にする操作を行わないでください。レプリケーションのパフォーマンスに悪影響を与える可能性があります。特定のフィールドでのみ非圧縮データを送信する必要がある場合は、フィールドレベルでこれらの特定のフィールドの非圧縮送信フラグを選択してください。レコード圧縮が SAP LT Replication Server から BigQuery に転送されるデータに与える影響の詳細については、BigQuery Connector for SAP の圧縮機能についてをご覧ください。

BigQuery のレプリケーション構成

BigQuery Connector for SAP を使用してレプリケーションを構成するときは、 Google Cloudが提供するカスタムトランザクションなど、さまざまな SAP トランザクションを使用します。

SM30 - Google Cloudに接続するためのプロパティを定義します。これは、カスタム構成テーブル /GOOG/CLIENT_KEY にレコードとして保存されます。また、RFC 宛先を使用してGoogle Cloud APIs やサービスに接続すると、一部の接続プロパティがカスタム構成テーブル /GOOG/SERVIC_MAP に保存されます。
LTRC - さまざまなプロパティのうち、BigQuery Connector for SAP レプリケーションアプリケーションと一括転送 ID を定義します。
SM59 - BigQuery や IAM などの Google CloudAPIs とサービスへの接続を可能にする RFC 宛先を定義します。
/GOOG/SLT_SETTINGS - ターゲットの BigQuery データセット、テーブル、フィールドのプロパティを定義します。SAP LT Replication Server に /GOOG/SLT_SETTINGS を入力する際は、/n を追加してトランザクション名の最初のスラッシュをエスケープする必要があります。

言語サポート

BigQuery Connector for SAP は、英語のレプリケーション構成のみをサポートしています。SAP トランザクションと Google Cloudが提供するカスタムトランザクションを使用してレプリケーションを構成する場合は、SAP ログオン画面でログオン言語として英語を使用します。

ただし、BigQuery Connector for SAP では、SAP LT Replication Server で実行されるバックグラウンドジョブを、SAP SLT でサポートされているすべての言語で実行できます。

BigQuery Connector for SAP の使用時に表示される可能性のあるエラーメッセージは、バックグラウンドジョブの実行言語に関係なく、英語で生成されます。

ターゲットテーブルのプロパティ

/GOOG/SLT_SETTINGS トランザクションを実行して SAP LT Replication Server でレプリケーションを構成する場合、BigQuery Connector for SAP が BigQuery にターゲットテーブルを作成する際に適用する設定を指定できます。

たとえば、ターゲット BigQuery テーブルに次のプロパティを指定できます。

テーブル名
フィールドのデフォルトの命名オプション
レコードの変更をキャプチャしてレコードカウントクエリを有効にする追加フィールド
テーブルのパーティショニング

フィールドのデフォルトの命名オプション

ソースフィールドの名前またはソースフィールドのラベルと説明から、ターゲット BigQuery テーブルのフィールド名を作成するように、BigQuery Connector for SAP を構成できます。通常、フィールドの内容については、ラベルと説明のほうが有益です。

デフォルトでは、BigQuery Connector for SAP はソースフィールドの名前を使用します。このデフォルトを変更するには、/GOOG/SLT_SETTINGS トランザクションの大量転送構成のテーブル作成属性で、カスタム名フラグを指定します。この仕様は /GOOG/BQ_MASTR 構成テーブルに格納されます。

名前を作成する際に、BigQuery Connector for SAP は BigQuery の命名規則に準拠するように名前を変更します。

テーブルが作成される前に、/GOOG/SLT_SETTINGS トランザクションのフィールドマッピング画面でフィールド名を編集できます。

カスタム名フラグが指定されていると、BigQuery Connector for SAP がターゲットテーブルの作成時に使用する名前がフィールドマッピング画面の [External Field Name] 列に表示されます。

BigQuery Connector for SAP は、各ソースフィールドの medium フィールドラベルを使用して [External Field Name] 列に名前を作成します。ソースフィールドの定義で medium フィールドラベルが指定されていない場合、フィールドの簡単な説明が使用されます。短い説明も指定されていない場合は、指定されたラベルの中で最も短いものが使用されます。何も指定しないと、ソースフィールドの名前が使用されます。

ターゲットフィールド名のカスタマイズの詳細については、ターゲットフィールド名のカスタマイズをご覧ください。

レコードの変更をキャプチャしてレコードカウントを有効にする

レプリケーションをトリガーしたソーステーブルでの変更タイプをキャプチャし、BigQuery テーブルのレコードカウントクエリを有効にして、SAP LT Replication Server またはソーステーブルのレコード数と比較できるようにするには、レプリケーションを構成するときに、/GOOG/SLT_SETTINGS トランザクションに追加フィールドフラグ オプションを指定します。

追加フィールドフラグ オプションを指定すると、次の列がターゲット BigQuery テーブルのスキーマに追加されます。

フィールド名データ型説明

フィールド名	データ型	説明
`operation_flag`	`STRING`	レコードの読み込みまたは BigQuery へのレプリケーションをトリガーしたソーステーブルでの変更タイプを特定します。レプリケーションモードで挿入されたレコードをカウントするには、`operation_flag` フィールドの値が `I`、`U`、または `D` のレコードをクエリします。クエリの例については、レプリケーションモードで挿入されたレコード数をクエリするをご覧ください。初期読み込みモードで挿入されたレコードをカウントするには、`operation_flag` フィールドの値が `L` のレコードをクエリします。クエリの例については、初期読み込みモードで挿入されたレコード数をクエリするをご覧ください。
`is_deleted`	`BOOLEAN`	`true` の場合、ソースレコードがソーステーブルから削除されたことを示します。 BigQuery テーブル内のレコードで、ソーステーブルから削除されていないレコードのみをカウントするには、`is_deleted` フィールドを使用して、削除されたソースレコードを除外します。クエリの例については、BigQuery テーブル内のレコードの合計数をクエリするをご覧ください。
`recordstamp`	`TIMESTAMP`	SAP LT Replication Server が BigQuery にレコードを送信した時刻。 BigQuery テーブル内の一意のレコード数をカウントするには、各レコードで最後に挿入されたインスタンスのみをクエリします。クエリの例については、BigQuery テーブル内のレコードの合計数をクエリするをご覧ください。

operation_flag

STRING

レコードの読み込みまたは BigQuery へのレプリケーションをトリガーしたソーステーブルでの変更タイプを特定します。

レプリケーションモードで挿入されたレコードをカウントするには、operation_flag フィールドの値が I、U、または D のレコードをクエリします。クエリの例については、レプリケーションモードで挿入されたレコード数をクエリするをご覧ください。

初期読み込みモードで挿入されたレコードをカウントするには、operation_flag フィールドの値が L のレコードをクエリします。クエリの例については、初期読み込みモードで挿入されたレコード数をクエリするをご覧ください。

is_deleted

BOOLEAN

true の場合、ソースレコードがソーステーブルから削除されたことを示します。

BigQuery テーブル内のレコードで、ソーステーブルから削除されていないレコードのみをカウントするには、is_deleted フィールドを使用して、削除されたソースレコードを除外します。クエリの例については、BigQuery テーブル内のレコードの合計数をクエリするをご覧ください。

recordstamp

TIMESTAMP

SAP LT Replication Server が BigQuery にレコードを送信した時刻。

BigQuery テーブル内の一意のレコード数をカウントするには、各レコードで最後に挿入されたインスタンスのみをクエリします。クエリの例については、BigQuery テーブル内のレコードの合計数をクエリするをご覧ください。

追加フィールドフラグ オプションの現在の設定は、/GOOG/BQ_MASTR 構成テーブルに格納されます。

追加フィールドフラグの詳しい指定方法については、以下をご覧ください。

Pub/Sub を介した CDC レプリケーションについては、テーブル作成とその他の一般的な属性を指定するをご覧ください。
ストリーミングデータレプリケーションについては、テーブル作成とその他の一般的な属性を指定するをご覧ください。

テーブルのパーティショニング

時間単位の列パーティション分割テーブルを作成するソーステーブルのタイムスタンプフィールド、またはレコードが BigQuery に挿入され、その結果、取り込み時間パーティション分割テーブルが作成された時刻のいずれかでパーティション分割された BigQuery テーブルを作成できます。

レプリケーションのプロパティを構成するときに、/GOOG/BQ_TABLE の [パーティションタイプ] フィールドでパーティションタイプを指定してパーティショニングを有効にします。

指定できるパーティションタイプは、時間、日、月、または年単位でパーティショニングの粒度を調整します。

ソーステーブルのタイムスタンプを時間単位の列パーティショニングに使用するには、[Partition Field] フィールドにソースフィールドの名前を指定します。

取り込み時間パーティショニングで BigQuery の挿入時間を使用するには、[Partition Field] を空白のままにします。BigQuery Connector for SAP は、挿入時間を格納するフィールドをターゲットテーブルに作成します。

ターゲットフィールドのプロパティ

デフォルトでは、BigQuery Connector for SAP は、SAP ソーステーブルのフィールド名とデータ型をターゲット BigQuery のフィールド名とデータ型として使用します。

必要に応じて、ターゲットテーブルを作成する前に、フィールド名をカスタマイズできます。または、BigQuery のデータ型を変更することもできます。

ターゲットフィールド名のカスタマイズ

テーブルを作成する前に、ターゲットフィールド名をカスタマイズできます。

BigQuery Connector for SAP は、必要に応じて、BigQuery 命名規則に準拠するように指定したカスタム名を変更します。

レプリケーションを構成するときに、/GOOG/SLT_SETTINGS トランザクションのフィールドマッピング画面でフィールド名を確認できます。BigQuery Connector for SAP は、/GOOG/BQ_FIELD 構成テーブルに設定を保存します。

テーブルを作成する前に、フィールドマッピング画面の [Temporary Field Name] 列で生成された名前を編集して、カスタムフィールド名を指定できます。値を削除し、[Temporary Field Name] フィールドを空白のままにした場合、BigQuery Connector for SAP は、ソースフィールドの名前をターゲットフィールドの名前として使用します。

[Temporary Field Name] を編集した後、[Save] をクリックすると、BigQuery Connector for SAP によって値が検証され、必要に応じて BigQuery の命名規則が適用されて変更が保存されます。Enter キーを押すと、値を保存せずに検証できます。

ターゲットフィールドのデフォルトの命名規則の設定については、フィールドのデフォルトの命名オプションをご覧ください。

スプレッドシートまたはテキストファイルを使用して BigQuery のフィールドマップを編集する

ターゲット BigQuery テーブルを作成する前に、オプションとして、ターゲットフィールドのデフォルトのデータ型、名前、説明をスプレッドシートまたはテキストファイルに保存できます。これにより、BigQuery データエンジニアまたは管理者は、SAP LT Replication Server にアクセスすることなく、これらの値を編集できます。

値を編集したら、ファイルとその内容をカンマ区切り値（CSV）形式に変換する必要があります。次に、カスタムトランザクション /GOOG/SLT_SETTINGS を使用して CSV ファイルをアップロードし、一括転送設定に更新を適用します。

CSV ファイルを使用して BigQuery フィールドマップを編集するプロセスでは、次の操作を行います。

デフォルトのフィールドマッピングを含むスプレッドシートまたはテキストファイルを作成します。
値を編集します。
スプレッドシートまたはテキストファイルを CSV 形式に変換します。
CSV ファイルをアップロードします。

各ステップの詳しい手順については、CSV ファイルで BigQuery フィールドマップを編集するをご覧ください。

フィールドの BigQuery 命名規則

BigQuery の命名規則では、小文字、数字、アンダースコアのみ使用できます。

BigQuery Connector for SAP は、ターゲットフィールドの名前として使用される入力値に BigQuery の命名規則を適用します。

たとえば、カスタムフィールド名として「FIELD-@#!*123」と入力すると、BigQuery Connector for SAP は名前を field_123 に変更します。

フィールドの BigQuery 命名規則について詳しくは、列名をご覧ください。

データ型マッピング

デフォルトでは、BigQuery Connector for SAP は、ソース SAP フィールドの SAP の種類または SAP のデータ型に基づいて、ターゲット BigQuery フィールドにデータ型を割り当てます。

Pub/Sub を介した CDC レプリケーションの場合、プロセスにはデータ型マッピングの中間ステップが含まれます。

BigQuery Connector for SAP から Pub/Sub: BigQuery Connector for SAP が Pub/Sub トピックにデータを送信すると、SAP データ型は最初に Pub/Sub Avro データ型に変換されます。
Pub/Sub から BigQuery: Pub/Sub の Avro 形式のデータは、BigQuery サブスクリプションを使用して BigQuery にストリーミングされます。この時点で、Pub/Sub は最終的な BigQuery データ型を割り当てます。

データフローをスムーズにし、正確な解釈を保証するには、Pub/Sub Avro データ型と最終的な BigQuery データ型に互換性が必要です。Pub/Sub トピックと BigQuery テーブルの間のスキーマ互換性については、スキーマの互換性をご覧ください。

レプリケーションを構成するときに、/GOOG/SLT_SETTINGS トランザクションのフィールドマッピング画面でデータ型を確認できます。BigQuery Connector for SAP は、/GOOG/BQ_FIELD 構成テーブルに設定を保存します。

テーブルが作成される前に、デフォルトのデータ型の仕様を別の BigQuery データ型と Pub/Sub Avro データ型に変更できます。

ブール値とタイムスタンプ: ターゲットテーブルでブール値とタイムスタンプのデータ型を正確に反映するには、ターゲットテーブルを作成する前に、ターゲットデータの型をそれぞれ BOOLEAN、TIMESTAMP に手動で変更する必要があります。詳細については、特別な処理が必要なデータ型をご覧ください。

特別な処理が必要なデータ型

一部の SAP データ型は、ターゲット BigQuery テーブルで正確に表現されるように特別な処理を必要とします。

これらのデータ型の一部は、ご自身で処理する必要があります。その他の処理は BigQuery Connector for SAP が行います。

ブール値

SAP では、ブール値にデータ型 CHAR を使用します。デフォルトでは、このデータ型は BigQuery Connector for SAP によってターゲット BigQuery テーブルの STRING データ型にマッピングされます。

ブール値の場合は、/GOOG/SLT_SETTINGS トランザクションを使用してレプリケーションを構成するときに、フィールドマッピング画面でブール値フィールドのデフォルトのデータ型の割り当てを STRING から BOOLEAN に変更する必要があります。

タイムスタンプ

SAP では、タイムスタンプにデータ型 P（10 進数のパック）または DEC（10 進数）を使用します。デフォルトでは、これらのデータ型は BigQuery Connector for SAP によってターゲット BigQuery テーブルの NUMERIC にマッピングされます。

タイムスタンプの場合は、/GOOG/SLT_SETTINGS トランザクションを使用してレプリケーションを構成するときに、フィールドマッピング画面でタイムスタンプフィールドのデフォルトのデータ型の割り当てを NUMERIC から TIMESTAMP または TIMESTAMP (LONG) に変更する必要があります。

SAP 型種類 `X`

SAP 型種類 X は 16 進数で、SAP のデータ型 RAW、RAWSTRING、または LRAW で表されます。デフォルトでは、BigQuery Connector for SAP はこれらのデータ型をソース BigQuery テーブルの STRING にマッピングします。

ソースフィールドで SAP 型種類 X を BYTES にマッピングする必要がある場合は、/GOOG/SLT_SETTINGS トランザクションのフィールドマッピング画面で、フィールドのデフォルトのデータ型割り当てを変更する必要があります。

SAP では、整数を表すために X という SAP 型種類が使用される場合もあります。この場合、BigQuery Connector for SAP は、ソースフィールドのデータ型が整数の SAP データ型 INT1、INT2、INT4、INT8 のいずれかどうかを確認し、ターゲット BigQuery テーブルで INTEGER データ型を割り当てます。

SAP 型種類 `y`

SAP 型種類 y はバイト文字列で、SAP の RAW、RAWSTRING、または LRAW データ型で表されます。デフォルトでは、BigQuery Connector for SAP はこれらのデータ型をソース BigQuery テーブルの STRING にマッピングします。

ソースフィールドで SAP 型種類 y を BYTES にマッピングする必要がある場合は、/GOOG/SLT_SETTINGS トランザクションのフィールドマッピング画面で、フィールドのデフォルトのデータ型割り当てを変更する必要があります。

`LRAW` SAP のデータ型

BigQuery Connector for SAP は、LRAW データ型を BigQuery に Base64 エンコード文字列として保存します。

Pub/Sub を介して CDC レプリケーションを使用している場合、コネクタは LRAW フィールドを UTF-8 エンコードに変換してから、Pub/Sub に送信します。この変換が行われても、コネクタは BigQuery にデータを Base64 として保存します。

コネクタの LRAW フィールドの値の UTF-8 変換では、先行する長さ列が示す最初のバイトのみが考慮されます。これは SAP 標準に準拠しています。この標準では、先行する長さフィールド（INT2 または INT4 タイプ）が LRAW コンテンツの有効な長さを定義します。

デフォルトのデータ型マッピング

次の表に、BigQuery Connector for SAP のデフォルトのデータ型変換を示します。

SAP 型種類	SAP のデータ型	BigQuery のデータ型	Pub/Sub Avro データ型	注
`b`（1 バイトの整数） `s`（2 バイトの整数） `I`（4 バイトの整数） `8`（8 バイトの整数）	`INT1` `INT2` `INT4` `INT8`	`INTEGER`	`INT`
`F`（浮動小数点）	`FLTP`	`FLOAT`	`FLOAT`
`P`（パック）	`CURR` `DEC` `QUAN`	`NUMERIC`	`DOUBLE`	デフォルトでは、SAP 型種類 `P` は BigQuery のデータ型 `NUMERIC` にマッピングされ、外部形式の数値に変換されます。
`a`（10 進の浮動小数点数、16 桁）	`DECFLOAT16`	`NUMERIC`	`DOUBLE`
`e`（10 進の浮動小数点数、16 桁）	`DECFLOAT34`	`NUMERIC`	`DOUBLE`
`N`（数値）	`NUMC`	`STRING`	`STRING`
`X`（16 進数） `y`（バイト文字列）	`RAW` `RAWSTRING` `LRAW`	`STRING`	`STRING`	SAP 型種類が `X` でも、データ型名でパターン `'INT*'`（`INT1`、`INT2`、`INT4`）に対応している場合は、ソースデータ要素が新しいデータ要素 `TYPEKIND '8'` の `TYPINT8` に置き換えられ、BigQuery のデータ型 `INTEGER` にマッピングされます。
`C`（文字） `g`（文字列） `?`（csequence） `&`（clike）	`CHARSTRING`	`STRING`	`STRING`
`D`（日付）	`DATS`	`DATE`	`STRING`
`T`（時間）	`TIMS`	`TIME`	`STRING`

ライセンス

BigQuery Connector for SAP は、 Google Cloud Platform の使用を規定する契約に基づき、「ソフトウェア」として提供されます。これには、https://cloud.google.com/terms/service-terms で入手できるサービス固有の規約が含まれます。前述の利用規約の一般性を制限することなく、Google からの明示的な書面による許可なく、BigQuery Connector for SAP を変更または配布することはできません。

BigQuery Connector for SAP ソフトウェアは無料で提供されています。明確さを期するため記載しますが、BigQuery、Pub/Sub、Pub/Sub API、Storage Write API、BigQuery ストリーミング API など、 Google Cloud Platform の使用を規定する契約に基づいて他の「ソフトウェア」および「サービス」を使用すると、費用が発生する可能性があります。

BigQuery Connector for SAP には、SAP LT Replication Server を含む（ただしこれらに限定されません）SAP ソフトウェアのライセンスは含まれていません。SAP ソフトウェアの適切なライセンスを別途入手する必要があります。

サポートライフサイクル

Google Cloud は、BigQuery Connector for SAP の最新のメジャーバージョンをサポートし、維持します。また、 Google Cloudでの SAP のリリースノートページでサポート終了のお知らせが公開されてから少なくとも 12 か月間は、以前のメジャーバージョンをサポートし、維持します。

次のステップ

BigQuery Connector for SAP のインストール方法については、BigQuery Connector for SAP をインストールするをご覧ください。

BigQuery Connector for SAP プランニング ガイド コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

ソフトウェア要件

SAP ソフトウェア バージョンの要件

S/4HANA

ECC

オペレーティング システムの要件

Cloud 請求先アカウントの要件

スケーラビリティ

サポートされているレプリケーション ソース

サポートされている SAP アプリケーション ソース

サポートされるデータソース

セキュリティ

SAP のセキュリティ

Google Cloud のセキュリティ

Google Cloud Identity and Access Management

BigQuery のデータセットとテーブルのアクセス制御

VPC Service Controls

Private Service Connect エンドポイント

Google Cloud のセキュリティに関する詳細

ネットワーキング

Google Cloudへの接続

RFC 宛先

HTTP 圧縮

帯域幅

レイテンシ

ネットワーク アクセス制御

Google Cloud のネットワーク アクセス制御

SAP LT Replication Server ホスト ネットワークのアクセス制御

パフォーマンス計画

パフォーマンスに関する一般的なベスト プラクティス

パフォーマンスに影響を与える可能性のあるその他の特性

SAP LT Replication Server のパフォーマンスに関する考慮事項

パフォーマンスと SAP LT Replication Server のインストール アーキテクチャ

パフォーマンスと LTRS の高度なレプリケーション設定

ネットワーク接続のパフォーマンス

データの転送

SAP LT Replication Server によって送信されるデータの量を調整する

部分サイズとチャンクサイズ

SAP LT Replication Server の部分サイズ

BigQuery Connector for SAP のチャンクサイズ

部分の送信に関連する処理オーバーヘッド

BigQuery の割り当て

Pub/Sub 割り当て

レコードの圧縮

BigQuery のレプリケーション構成

言語サポート

ターゲット テーブルのプロパティ

フィールドのデフォルトの命名オプション

レコードの変更をキャプチャしてレコード カウントを有効にする

テーブルのパーティショニング

ターゲット フィールドのプロパティ

ターゲット フィールド名のカスタマイズ

スプレッドシートまたはテキスト ファイルを使用して BigQuery のフィールド マップを編集する

フィールドの BigQuery 命名規則

データ型マッピング

特別な処理が必要なデータ型

ブール値

タイムスタンプ

SAP 型種類 X

SAP 型種類 y

LRAW SAP のデータ型

デフォルトのデータ型マッピング

ライセンス

サポート ライフサイクル

次のステップ

BigQuery Connector for SAP プランニングガイド

SAP ソフトウェアバージョンの要件

オペレーティングシステムの要件

サポートされているレプリケーションソース

サポートされている SAP アプリケーションソース

ネットワークアクセス制御

Google Cloud のネットワークアクセス制御

SAP LT Replication Server ホストネットワークのアクセス制御

パフォーマンスに関する一般的なベストプラクティス

パフォーマンスと SAP LT Replication Server のインストールアーキテクチャ

パフォーマンスと `LTRS` の高度なレプリケーション設定

ターゲットテーブルのプロパティ

レコードの変更をキャプチャしてレコードカウントを有効にする

ターゲットフィールドのプロパティ

ターゲットフィールド名のカスタマイズ

スプレッドシートまたはテキストファイルを使用して BigQuery のフィールドマップを編集する

SAP 型種類 `X`

SAP 型種類 `y`

`LRAW` SAP のデータ型

サポートライフサイクル