本页面介绍了在 Cloud Data Fusion 中使用 Salesforce 批量来源时提高性能的最佳实践。
通过 PK 分块提升性能
PK 分块将较大的数据集分解为较小的数据集(也称为“数据块”)。
在 Salesforce 批处理来源插件中启用 PK 分块具有以下优势:
- 提高了性能,尤其是对于大型数据集
- 它可以降低服务器的负载
- 提高可伸缩性
如需使用 PK 分块,请按以下步骤操作:
- 转到 Cloud Data Fusion 网页界面并在 Studio 页面上打开流水线。
- 可选:如果您尚未在流水线中添加 Salesforce 节点,请添加一个:
- 在来源菜单中,点击 Salesforce。Salesforce 节点会显示在您的流水线中。如果您在 Studio 页面上没有看到 Salesforce 来源,请从 Cloud Data Fusion Hub 部署 Salesforce 插件。
- 若要配置来源,请前往 Salesforce 节点,然后点击属性。
- 开启启用 PK 分块。
- 在分块大小字段中,输入每个分块的记录数。默认值为
100000
记录。最多250000
条记录。 - 点击验证。
使用 SObject 查询过滤器或 SOQL 查询
要减少 Salesforce 中的 API 调用次数,请使用 SObject 查询过滤器或 SOQL 查询检索记录。
SObject 查询过滤条件:在 Salesforce 插件属性中的 SObject name 字段配置过滤条件。如需了解详情,请参阅配置插件。
SOQL 查询:在 Salesforce 插件属性的 SOQL 查询字段中配置查询。如需了解详情,请参阅针对 Salesforce 来源的 SOQL 查询。
后续步骤
- 了解如何在 Cloud Data Fusion 中配置 Salesforce 批量来源。
- 完成 Salesforce 插件教程。