有关 Salesforce 批量来源的最佳实践

本页面介绍了在 Cloud Data Fusion 中使用 Salesforce 批量来源时提高性能的最佳实践。

通过 PK 分块提升性能

PK 分块将较大的数据集分解为较小的数据集(也称为“数据块”)。

在 Salesforce 批处理来源插件中启用 PK 分块具有以下优势:

  • 提高了性能,尤其是对于大型数据集
  • 它可以降低服务器的负载
  • 提高可伸缩性

如需使用 PK 分块,请按以下步骤操作:

  1. 转到 Cloud Data Fusion 网页界面并在 Studio 页面上打开流水线。
  2. 可选:如果您尚未在流水线中添加 Salesforce 节点,请添加一个:
    1. 来源菜单中,点击 Salesforce。Salesforce 节点会显示在您的流水线中。如果您在 Studio 页面上没有看到 Salesforce 来源,请从 Cloud Data Fusion Hub 部署 Salesforce 插件
  3. 若要配置来源,请前往 Salesforce 节点,然后点击属性
  4. 开启启用 PK 分块
  5. 分块大小字段中,输入每个分块的记录数。默认值为 100000 记录。最多 250000 条记录。
  6. 点击验证

使用 SObject 查询过滤器或 SOQL 查询

要减少 Salesforce 中的 API 调用次数,请使用 SObject 查询过滤器或 SOQL 查询检索记录。

  • SObject 查询过滤条件:在 Salesforce 插件属性中的 SObject name 字段配置过滤条件。如需了解详情,请参阅配置插件

  • SOQL 查询:在 Salesforce 插件属性的 SOQL 查询字段中配置查询。如需了解详情,请参阅针对 Salesforce 来源的 SOQL 查询

后续步骤