このページでは、Cloud Data Fusion で Salesforce バッチソースを使用する際のパフォーマンス向上のベスト プラクティスについて説明します。
PK チャンキングでパフォーマンスを改善する
PK チャンクは、大きなデータセットを小さなデータセットまたはチャンクに分割します。
Salesforce バッチソース プラグインで PK チャンキングを有効にすると、次のメリットがあります。
- 特に大規模なデータセットでパフォーマンスが向上します。
- サーバーの負荷を軽減する
- スケーラビリティが向上する
PK チャンキングを使用する手順は次のとおりです。
- Cloud Data Fusion ウェブ インターフェースに移動し、[Studio] ページでパイプラインを開きます。
- 省略可: パイプラインに Salesforce ノードを追加していない場合は、追加します。
- [ソース] メニューで [Salesforce] をクリックします。Salesforce ノードがパイプラインに表示されます。[Studio] ページに Salesforce ソースが表示されない場合は、Cloud Data Fusion ハブから Salesforce プラグインをデプロイします。
- ソースを構成するには、Salesforce ノードに移動して [プロパティ] をクリックします。
- [PK チャンキングを有効にする] をオンにします。
- [チャンクサイズ] フィールドに、チャンクあたりのレコード数を入力します。デフォルト値は
100000
レコードです。最大値は250000
レコードです。 - [検証] をクリックします。
sObject クエリフィルタまたは SOQL クエリを使用する
Salesforce での API 呼び出しの数を減らすには、SObject クエリフィルタまたは SOQL クエリを使用してレコードを取得します。
SObject クエリフィルタ: Salesforce プラグイン プロパティの [SObject name] フィールドでフィルタを構成します。詳細については、プラグインを構成するをご覧ください。
SOQL クエリ: Salesforce プラグインのプロパティの [SOQL クエリ] フィールドでクエリを構成します。詳細については、Salesforce ソースの SOQL クエリをご覧ください。
次のステップ
- Cloud Data Fusion での Salesforce バッチソースの構成について確認する。
- Salesforce プラグインのチュートリアルを実施する。