Salesforce バッチソースのベスト プラクティス

このページでは、Cloud Data Fusion で Salesforce バッチソースを使用する際のパフォーマンス向上のベスト プラクティスについて説明します。

PK チャンキングでパフォーマンスを改善する

PK チャンクは、大きなデータセットを小さなデータセットまたはチャンクに分割します。

Salesforce バッチソース プラグインで PK チャンキングを有効にすると、次のメリットがあります。

  • 特に大規模なデータセットでパフォーマンスが向上します。
  • サーバーの負荷を軽減する
  • スケーラビリティが向上する

PK チャンキングを使用する手順は次のとおりです。

  1. Cloud Data Fusion ウェブ インターフェースに移動し、[Studio] ページでパイプラインを開きます。
  2. 省略可: パイプラインに Salesforce ノードを追加していない場合は、追加します。
    1. [ソース] メニューで [Salesforce] をクリックします。Salesforce ノードがパイプラインに表示されます。[Studio] ページに Salesforce ソースが表示されない場合は、Cloud Data Fusion ハブから Salesforce プラグインをデプロイします。
  3. ソースを構成するには、Salesforce ノードに移動して [プロパティ] をクリックします。
  4. [PK チャンキングを有効にする] をオンにします。
  5. [チャンクサイズ] フィールドに、チャンクあたりのレコード数を入力します。デフォルト値は 100000 レコードです。最大値は 250000 レコードです。
  6. [検証] をクリックします。

sObject クエリフィルタまたは SOQL クエリを使用する

Salesforce での API 呼び出しの数を減らすには、SObject クエリフィルタまたは SOQL クエリを使用してレコードを取得します。

  • SObject クエリフィルタ: Salesforce プラグイン プロパティの [SObject name] フィールドでフィルタを構成します。詳細については、プラグインを構成するをご覧ください。

  • SOQL クエリ: Salesforce プラグインのプロパティの [SOQL クエリ] フィールドでクエリを構成します。詳細については、Salesforce ソースの SOQL クエリをご覧ください。

次のステップ