このページでは、Cloud Data Fusion で Salesforce バッチソースを使用する場合のパフォーマンスを向上させるためのベスト プラクティスについて説明します。
PK チャンクによるパフォーマンスの向上
PK チャンクは、大きなデータセットを小さなデータセットまたはチャンクに分割します。
Salesforce バッチソース プラグインで PK チャンクを有効にすると、次のような利点があります。
- 特に大規模なデータセットのパフォーマンスが向上する
- サーバーの負荷が軽減される
- スケーラビリティが向上する
PK チャンクを使用するには、次の手順を行います。
- Cloud Data Fusion ウェブ インターフェースに移動し、[Studio] ページでパイプラインを開きます。
- (省略可)パイプラインに Salesforce ノードを追加していない場合は、1 つ追加します。
- [Source] メニューで、[Salesforce] をクリックします。Salesforce ノードがパイプラインに表示されます。[Studio] ページに Salesforce ソースが表示されない場合は、Cloud Data Fusion Hub から Salesforce プラグインをデプロイします。
- ソースを構成するには、Salesforce ノードに移動して [プロパティ] をクリックします。
- [PK チャンクの有効化] をオンにします。
- [チャンクサイズ] フィールドに、チャンクあたりのレコード数を入力します。デフォルト値は
100000
レコードです。最大数は250000
レコードです。 - [検証] をクリックします。
SObject クエリフィルタまたは SOQL クエリを使用する
Salesforce の API 呼び出し数を減らすには、SObject クエリフィルタまたは SOQL クエリを使用してレコードを取得します。
SObject クエリフィルタ: [SObject 名] フィールドの Salesforce プラグイン プロパティでフィルタを構成します。詳細については、プラグインを構成するをご覧ください。
SOQL クエリ: [SOQL クエリ] フィールドの Salesforce プラグイン プロパティでクエリを構成します。詳細については、Salesforce ソースの SOQL クエリをご覧ください。
次のステップ
- Cloud Data Fusion での Salesforce バッチソースの構成について確認する。
- Salesforce プラグインのチュートリアルを実施する。