通过 SAP Datasphere 将数据从 SAP S/4HANA 复制到 BigQuery

本文档简要介绍如何通过 SAP Datasphere 将数据从 SAP S/4HANA 复制到 BigQuery。SAP Datasphere 提供强大的数据转换功能,并可确保数据正确加载到 BigQuery 中。它使用 BigQuery Storage Write API 以近乎实时的方式将数据写入 BigQuery 数据集。

复制方法

如需从 SAP S/4HANA 源系统读取数据,您可以使用以下复制方法之一:

  • 基于 CDS 的复制:此方法使用核心数据服务 (Core Data Services, CDS) 视图,这些视图具有丰富的语义并在 SAP S/4HANA 中提供预定义的业务数据模型。

  • 基于 SLT 的复制:此方法直接从 SAP S/4HANA 系统复制底层数据库表,通常使用 SAP Landscape Transformation (SLT) 作为复制技术。然后,可将复制的表用作 Google Cloud Cortex Framework 的数据基础。

主要区别和注意事项

下表总结了这两种复制方法之间的主要区别:

功能 基于 CDS 的复制 基于 SLT 的复制
数据表示法 提供以业务为导向的数据视图,通常将多个表中的数据组合成有意义的结构。 提供对原始表结构的直接访问。如果您需要对数据进行精细控制或需要复制自定义的表,则此复制方法适合您的需求。
易用性 如果您在 SAP Datasphere 中使用预先提供的 CDS 视图,则设置复制更加简单。 可能需要更多技术配置,尤其是初始设置 SLT 和处理表依赖项。
灵活性 如果您需要复制自定义的表或未通过标准 CDS 视图公开的表,则灵活性较低。 提供更大的灵活性来复制任何表,包括定制开发的表。
性能
  • 由于业务逻辑和增量计算,导致生产数据库上产生额外的 CPU 消耗。此方法可能需要将额外的 CPU 资源用于 SAP 数据库。
  • 由于 CDS 视图逻辑中可能进行预聚合,因此传输的数据较少。
  • 复制整个表,导致网络流量增加,因此这种方法属于网络密集型。但是,它需要消耗的数据库 CPU 资源较少。
  • 由于无需预聚合即可复制完整的表,因此会传输较多数据。
Google Cortex Framework 兼容性 与预先提供的技术加速器不兼容。 与预先提供的技术加速器完全兼容。

选择复制方法

最适合您的复制方法取决于多种因素,包括预期应用场景和其他注意事项,例如:

  • 业务要求:如果您主要需要标准业务数据并希望快速设置,则基于 CDS 的复制可能是一个不错的选择。如果您需要更专业的数据或者您具有高度自定义的表,请考虑基于 SLT 的复制。

  • Cortex Framework 兼容性。如果您想使用 Cortex Framework,请使用基于 SLT 的复制。

  • 技术专业知识:对具备 SAP Basis 或数据复制专业知识的用户而言,基于 CDS 的复制更易于使用。

  • 数据量和复杂性:如果数据量高达数 TB 或者表关系复杂,则基于 SLT 的复制可能更具可伸缩性。

后续步骤