SAP Procure to Pay 加速器

用于采购到支付流程的 SAP 加速器是 Cloud Data Fusion 中 SAP Table Batch Source功能的示例实现。当您创建端到端的采购到付款流程和分析时,SAP Procure to Pay 加速器可以帮助您入门。其中包含的示例 Cloud Data Fusion 流水线可配置为执行以下任务:

  • 连接到您的 SAP 数据源。
  • 在 Cloud Data Fusion 中对数据执行转换。
  • 将您的数据存储在 BigQuery 中。
  • 在 Looker 中设置分析。这包括信息中心和机器学习模型,您可以在其中为采购到支付流程定义关键绩效指标 (KPI)。

本指南介绍了示例实现,以及您如何开始使用配置。

此加速器适用于在版本 6.4.0 及更高版本中运行的 Cloud Data Fusion 环境。

准备工作

  1. Sign in to your Google Account.

    If you don't already have one, sign up for a new account.

  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Cloud Data Fusion and BigQuery APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Cloud Data Fusion and BigQuery APIs.

    Enable the APIs

  8. 下载 SAP Table Batch Source
  9. 您必须拥有 Looker 实例访问权限,并且已启用 Marketplace 实验室功能,才能安装 Looker 块。您可以申请免费试用来获取实例访问权限。

所需技能

设置 SAP Procure to Pay 加速器需要以下技能:

所需用户

本页面介绍的配置需要在您的 SAP 系统和 Google Cloud 中进行更改。您需要与这些系统的以下用户合作来执行配置:

用户类型 说明
SAP 管理员 可访问 SAP 服务网站下载软件的 SAP 系统管理员。
SAP 用户 有权连接到 SAP 系统的 SAP 用户。
GCP 管理员 控制您的组织的 IAM 访问权限、创建和部署服务账号并授予对 Cloud Data Fusion、BigQuery 和 Looker 的权限的管理员。
Cloud Data Fusion 用户 有权在 Cloud Data Fusion 中设计和运行数据流水线的用户。
BigQuery 数据所有者 有权创建、查看和修改 BigQuery 数据集的用户。
Looker 开发者 这些用户可以通过 Marketplace 安装 Looker 块。他们必须拥有 developmanage_modeldeploy 权限。

所需 IAM 角色

在加速器的示例实现中,需要以下 IAM 角色。如果您的项目依赖于其他 Google Cloud 服务,则可能需要其他角色。

过程概览

您可以按照以下步骤在项目中实现加速器:

  1. 配置 SAP ERP 系统安装提供的 SAP 传输
  2. 设置 Cloud Data Fusion 环境以使用 SAP Table Batch Source 插件
  3. 在 BigQuery 中创建数据集。加速器为暂存、维度和事实表提供示例数据集。
  4. 将来自加速器的示例 Cloud Data Fusion 流水线配置为集成 SAP 数据。
  5. 在 Cloud Data Fusion 中心部署与采购到支付分析过程关联的流水线。必须正确配置这些流水线才能创建 BigQuery 数据集。
  6. 将 Looker 连接到 BigQuery 项目。
  7. 安装并部署 Looker 块。

如需了解详情,请参阅使用 SAP Table Batch Source 插件

BigQuery 中的示例数据集

在此加速器的示例实现中,系统在 BigQuery 中创建了以下数据集。

数据集名称 说明
sap_cdf_staging 包含 SAP 源系统中针对相关业务流程标识的所有表。
sap_cdf_dimension 包含客户维度和物料维度的关键维度实体。
sap_cdf_fact 包含通过流水线生成的事实表。

Cloud Data Fusion 中的示例流水线

Cloud Data Fusion Hub 中提供了此加速器的示例流水线。

如需从 Hub 获取示例流水线,请执行以下操作:

  1. 转到您的实例:
    1. 在 Google Cloud 控制台中,转到 Cloud Data Fusion 页面。

    2. 如需在 Cloud Data Fusion Studio 中打开实例,请点击实例,然后点击查看实例

      转到实例

  2. 点击 Hub
  3. 选择 SAP 标签页。
  4. 选择流水线。将打开一个示例流水线页面。
  5. 选择所需的流水线进行下载。

每个流水线都包含您可以配置为在环境中运行的宏。

示例流水线有三种类型:

  • 暂存层流水线:此类流水线中的暂存数据集是 SAP 中原始源表的直接映射。示例暂存层流水线的名称引用了 SAP 源表和 BigQuery 目标表。例如,名为 LFA1_Supplier_Master 的流水线指的是 SAP 源表 (LFA1) 和 BigQuery 目标表 (CustomerMaster)。
  • 维度层流水线:此类流水线中的维度层数据集是精选优化的暂存数据集版本,用于创建分析所需的维度和事实。示例流水线的名称表示目标 BigQuery 数据集中的目标实体。例如,名为 customer_dimension 的流水线指的是 BigQuery 数据集 sap_cdf_fact 中的客户维度实体。
  • 事实层流水线:事实层数据集是精选优化的暂存数据集版本,用于创建分析所需的事实。这些示例流水线的名称表示目标 BigQuery 数据集中的目标实体。例如,名为 sales_order_fact 的流水线将精选数据提供给相应 BigQuery 数据集 sap_cdf_fact 中的销售订单事实实体。

以下部分总结了如何使流水线在您的环境中运行。

配置暂存层流水线

暂存流水线有两个配置步骤:

  1. 配置源 SAP 系统。
  2. 配置目标 BigQuery 数据集和表。

SAP Table Batch Source 插件的参数

SAP Table Batch Source 插件会读取 SAP 表或视图的内容。加速器提供以下宏,您可以修改这些宏以集中控制 SAP 连接。

宏名称 说明 示例
${SAP Client} 要使用的 SAP 客户端 100
${SAP Language} SAP 登录语言 EN
${SAP Application Server Host} SAP 服务器名称或 IP 地址 10.132.0.47
${SAP System Number} SAP 系统编号 00
${secure(saplogonusername)} SAP 用户名 如需了解详情,请参阅使用安全密钥
${secure(saplogonpassword)} SAP 用户密码 如需了解详情,请参阅使用安全密钥
${Number of Rows to Fetch} 限制提取的记录数量 100000

如需了解详情,请参阅配置插件

BigQuery 目标的参数

加速器为 BigQuery 目标提供以下宏。

BigQuery 目标连接器配置

宏名称 说明 示例
${ProjectID} 在其中创建 BigQuery 数据集的项目的 ID。 sap_adaptor
${Dataset} 目标数据集 sap_cdf_staging

用于采购到支付 KPI 的示例流水线

采购到支付流程中的以下关键业务实体与加速器中的示例流水线相对应。这些流水线提供了有助于这些实体分析的数据。

主要业务实体 对应的流水线名称
Supplier SAP 源表会捕获与业务相关的供应商的详细信息。这些表中的信息会影响数据仓库维度层中的 supplier_dimension LFA1_SupplierMaster
LFB1_SupplierMasterCompanyCode
BUT000_BPGeneralInformation
MaterialProduct 是企业与其客户之间的交易商品。这些表中的信息会影响数据仓库维度层中的 material_dimension。 MARA_MaterialMaster
采购到支付流程从订单开始,其中包括订购数量和物料项的详细信息。 EKKO_PurchaseOrderHeader
EKPO_PurchaseOrdertItem
商品接收子流程,包括关于物料项的移动详情。 MATDOC_GoodsReceipt
账单结算子流程,包括请求的账单单据详细信息。 RBKP_InvoiceHeader
RSEG_InvoiceLineItem
采购到支付流程会在您的系统记录账单付款之后结束。 ACDOCA_UniversalJournalItem

所有 Cloud Data Fusion 暂存流水线

加速器中提供了以下 Cloud Data Fusion 暂存流水线示例:

  • ACDOCA_JournalLedgerDetails
  • ADR6_SupplierMasterEMailDetails
  • ADRC_SupplierMasterAddressDetails
  • BKPF_AccountingDocumentHeaderDetail
  • BSEG_AccountDocumentItem
  • BUT000_BusinessPartnerGeneralDataDetails
  • BUT020_BusinessPartnerAddressDetails
  • CEPCT_ProfitCenterDescription
  • EBAN_PurchaseRequisitionDetails
  • EKBE_PurchaseOrderHistoryDetail
  • EKET_PurchaseOrderScheduleLinesDetail
  • EKKO_PurchaseOrderHeaderDetail
  • EKPO_PurchaseOrderItemDetail
  • FINSC_BTTYPE_T_BusinessTransactionTypeDescription
  • FINSC_LEDGER_T_JournalLedgerDescription
  • LFA1_SupplierMasterDetails
  • LFB1_SupplierMasterCompanyCodeDetails
  • MARA_MaterialMaster
  • MATDOC_MaterialMovementDetails
  • MKPF_MaterialMovementHeaderDetail
  • MSEG_MaterialMovementItemDetail
  • RBKP_InvoiceReceiptHeaderDetail
  • RSEG_IncomingInvoiceItemDetail
  • T001_CompanyCodes
  • T001_CompanyCodes
  • T001K_ValuationAreaDetails
  • T001L_MaterialStorageLocation
  • T001W_PlantDetails
  • T002T_LanguageKeyDescription
  • T003T_AccountingDocumentTypeDescription
  • T005_CountryMaster
  • T006A_UnitOfMeasure
  • T007S_PurchaseSalesTaxCodeDescription
  • T023T_MaterialGroupDescription
  • T024_PurchasingGroupsDetails
  • T024E_PurchasingOrganizationsDetails
  • T024W_PlantPurchasingOrganizationsDetails
  • T156HT_MaterialMovementTypeDescription
  • T161T_PurchasingDocumentTypeDescription
  • T163M_ConfirmationCategoryDescription
  • T16FE_PurchaseDocumentReleaseIndicatorDescription
  • TBSLT_PostingKeyDescription
  • TCURT_CurrencyCodesText
  • TKA01_ControllingAreaMaster

配置维度层流水线

您可以从源 SAP 表中提取 KPI。如需准备数据以供分析,请对源表中的数据进行整理,使其与 BigQuery 表的架构结构匹配。

加速器会创建以下示例表:

表名称 表的说明
Supplier_dimension 供应商及其相关事实(例如供应商一般信息和供应商销售相关信息)的精选列表*。
Material_dimension 物料及其关联事实(例如 SKU 编号、产品层次结构和分类)的精选列表。
Purchase_Order_Fact 采购订单列表,其中包括采购组织、群组和订单类型。
Goods_Receipt_Fact 商品接收的精选列表,包括利润中心和移动类型信息。
Invoice_Fact 账单相关信息精选列表,包括账单类型、商品数量、价值以及账单过账日期。
Accounting_Fact 每个采购订单订单项的会计过账精选列表。

*在此上下文中,精选列表来自应用于所选列列表的业务逻辑。

加速器使用 SQL 脚本构建 BigQuery 数据集的维度层,您可以根据项目进行修改。例如,您可以调整这些脚本以向目标 BigQuery 数据集实体添加更多列。

为架构加注星标的转换:BigQuery 执行程序流水线名称

Cloud Data Fusion 中的以下 BigQuery 执行程序流水线会将数据加载到维度表和事实表中:

所有维度转换流水线:

  • Supplier_dimension
  • Material_dimension
  • Purchase_Order_Fact
  • Goods_Receipt_Fact
  • Invoice_Fact
  • Accounting_Fact

BigQuery 执行程序配置

宏名称 示例
${ProjectID} sap_adaptor
${StagingDatasetName} sap_cdf_staging
${TargetDatasetName} sap_cdf_dimension

将 Looker 连接到 BigQuery 项目

如需将 Looker 连接到 BigQuery,请参阅有关 BigQuery 连接的 Looker 文档。

安装块

您可以在 GitHub 上访问 SAP Looker 块

Looker 块安装了具有两个探索环境和两个信息中心的预配置 LookML 模型。

后续步骤