用于采购到支付流程的 SAP 加速器是 Cloud Data Fusion 中 SAP Table Batch Source功能的示例实现。当您创建端到端的采购到付款流程和分析时,SAP Procure to Pay 加速器可以帮助您入门。其中包含的示例 Cloud Data Fusion 流水线可配置为执行以下任务:
- 连接到您的 SAP 数据源。
- 在 Cloud Data Fusion 中对数据执行转换。
- 将您的数据存储在 BigQuery 中。
- 在 Looker 中设置分析。这包括信息中心和机器学习模型,您可以在其中为采购到支付流程定义关键绩效指标 (KPI)。
本指南介绍了示例实现,以及您如何开始使用配置。
此加速器适用于在版本 6.4.0 及更高版本中运行的 Cloud Data Fusion 环境。
准备工作
-
Sign in to your Google Account.
If you don't already have one, sign up for a new account.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion and BigQuery APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Data Fusion and BigQuery APIs.
- 下载 SAP Table Batch Source。
- 您必须拥有 Looker 实例访问权限,并且已启用 Marketplace 实验室功能,才能安装 Looker 块。您可以申请免费试用来获取实例访问权限。
所需技能
设置 SAP Procure to Pay 加速器需要以下技能:
- SAP 本地 ERP 系统和配置方面的专业知识
- 熟悉 Cloud Data Fusion
- 熟悉 BigQuery
- 熟悉 Looker
- 熟悉 Identity and Access Management (IAM) 服务账号和访问权限控制
- 熟悉数据分析,包括编写 SQL 查询
- 熟悉 Kimball 的维度数据模型
所需用户
本页面介绍的配置需要在您的 SAP 系统和 Google Cloud 中进行更改。您需要与这些系统的以下用户合作来执行配置:
用户类型 | 说明 |
---|---|
SAP 管理员 | 可访问 SAP 服务网站下载软件的 SAP 系统管理员。 |
SAP 用户 | 有权连接到 SAP 系统的 SAP 用户。 |
GCP 管理员 | 控制您的组织的 IAM 访问权限、创建和部署服务账号并授予对 Cloud Data Fusion、BigQuery 和 Looker 的权限的管理员。 |
Cloud Data Fusion 用户 | 有权在 Cloud Data Fusion 中设计和运行数据流水线的用户。 |
BigQuery 数据所有者 | 有权创建、查看和修改 BigQuery 数据集的用户。 |
Looker 开发者 | 这些用户可以通过 Marketplace 安装 Looker 块。他们必须拥有 develop 、manage_model 和 deploy 权限。 |
所需 IAM 角色
在加速器的示例实现中,需要以下 IAM 角色。如果您的项目依赖于其他 Google Cloud 服务,则可能需要其他角色。
- BigQuery Admin
(
roles/bigquery.admin
) - BigQuery Data Owner
(
roles/bigquery.dataOwner
) - Storage Object Viewer
(
roles/storage.objectViewer
) - 需要将 Cloud Data Fusion Runner (
roles/datafusion.runner
) 授予 Dataproc 服务账号
过程概览
您可以按照以下步骤在项目中实现加速器:
- 配置 SAP ERP 系统并安装提供的 SAP 传输。
- 设置 Cloud Data Fusion 环境以使用 SAP Table Batch Source 插件。
- 在 BigQuery 中创建数据集。加速器为暂存、维度和事实表提供示例数据集。
- 将来自加速器的示例 Cloud Data Fusion 流水线配置为集成 SAP 数据。
- 在 Cloud Data Fusion 中心部署与采购到支付分析过程关联的流水线。必须正确配置这些流水线才能创建 BigQuery 数据集。
- 将 Looker 连接到 BigQuery 项目。
- 安装并部署 Looker 块。
如需了解详情,请参阅使用 SAP Table Batch Source 插件。
BigQuery 中的示例数据集
在此加速器的示例实现中,系统在 BigQuery 中创建了以下数据集。
数据集名称 | 说明 |
---|---|
sap_cdf_staging |
包含 SAP 源系统中针对相关业务流程标识的所有表。 |
sap_cdf_dimension |
包含客户维度和物料维度的关键维度实体。 |
sap_cdf_fact |
包含通过流水线生成的事实表。 |
Cloud Data Fusion 中的示例流水线
Cloud Data Fusion Hub 中提供了此加速器的示例流水线。
如需从 Hub 获取示例流水线,请执行以下操作:
- 转到您的实例:
在 Google Cloud 控制台中,转到 Cloud Data Fusion 页面。
如需在 Cloud Data Fusion Studio 中打开实例,请点击实例,然后点击查看实例。
- 点击 Hub。
- 选择 SAP 标签页。
- 选择流水线。将打开一个示例流水线页面。
- 选择所需的流水线进行下载。
每个流水线都包含您可以配置为在环境中运行的宏。
示例流水线有三种类型:
- 暂存层流水线:此类流水线中的暂存数据集是 SAP 中原始源表的直接映射。示例暂存层流水线的名称引用了 SAP 源表和 BigQuery 目标表。例如,名为
LFA1_Supplier_Master
的流水线指的是 SAP 源表 (LFA1
) 和 BigQuery 目标表 (CustomerMaster
)。 - 维度层流水线:此类流水线中的维度层数据集是精选优化的暂存数据集版本,用于创建分析所需的维度和事实。示例流水线的名称表示目标 BigQuery 数据集中的目标实体。例如,名为
customer_dimension
的流水线指的是 BigQuery 数据集sap_cdf_fact
中的客户维度实体。 - 事实层流水线:事实层数据集是精选优化的暂存数据集版本,用于创建分析所需的事实。这些示例流水线的名称表示目标 BigQuery 数据集中的目标实体。例如,名为
sales_order_fact
的流水线将精选数据提供给相应 BigQuery 数据集sap_cdf_fact
中的销售订单事实实体。
以下部分总结了如何使流水线在您的环境中运行。
配置暂存层流水线
暂存流水线有两个配置步骤:
- 配置源 SAP 系统。
- 配置目标 BigQuery 数据集和表。
SAP Table Batch Source 插件的参数
SAP Table Batch Source 插件会读取 SAP 表或视图的内容。加速器提供以下宏,您可以修改这些宏以集中控制 SAP 连接。
宏名称 | 说明 | 示例 |
---|---|---|
${SAP Client} |
要使用的 SAP 客户端 | 100 |
${SAP Language} |
SAP 登录语言 | EN |
${SAP Application Server Host} |
SAP 服务器名称或 IP 地址 | 10.132.0.47 |
${SAP System Number} |
SAP 系统编号 | 00 |
${secure(saplogonusername)} |
SAP 用户名 | 如需了解详情,请参阅使用安全密钥。 |
${secure(saplogonpassword)} |
SAP 用户密码 | 如需了解详情,请参阅使用安全密钥。 |
${Number of Rows to Fetch} |
限制提取的记录数量 | 100000 |
如需了解详情,请参阅配置插件。
BigQuery 目标的参数
加速器为 BigQuery 目标提供以下宏。
BigQuery 目标连接器配置
宏名称 | 说明 | 示例 |
---|---|---|
${ProjectID} |
在其中创建 BigQuery 数据集的项目的 ID。 | sap_adaptor |
${Dataset} |
目标数据集 | sap_cdf_staging |
用于采购到支付 KPI 的示例流水线
采购到支付流程中的以下关键业务实体与加速器中的示例流水线相对应。这些流水线提供了有助于这些实体分析的数据。
主要业务实体 | 对应的流水线名称 |
---|---|
Supplier SAP 源表会捕获与业务相关的供应商的详细信息。这些表中的信息会影响数据仓库维度层中的 supplier_dimension 。 |
LFA1_SupplierMaster
|
Material 或 Product 是企业与其客户之间的交易商品。这些表中的信息会影响数据仓库维度层中的 material_dimension。 |
MARA_MaterialMaster |
采购到支付流程从订单开始,其中包括订购数量和物料项的详细信息。 |
EKKO_PurchaseOrderHeader
|
商品接收子流程,包括关于物料项的移动详情。 |
MATDOC_GoodsReceipt
|
账单结算子流程,包括请求的账单单据详细信息。 |
RBKP_InvoiceHeader
|
采购到支付流程会在您的系统记录账单付款之后结束。 |
ACDOCA_UniversalJournalItem
|
所有 Cloud Data Fusion 暂存流水线
加速器中提供了以下 Cloud Data Fusion 暂存流水线示例:
ACDOCA_JournalLedgerDetails
ADR6_SupplierMasterEMailDetails
ADRC_SupplierMasterAddressDetails
BKPF_AccountingDocumentHeaderDetail
BSEG_AccountDocumentItem
BUT000_BusinessPartnerGeneralDataDetails
BUT020_BusinessPartnerAddressDetails
CEPCT_ProfitCenterDescription
EBAN_PurchaseRequisitionDetails
EKBE_PurchaseOrderHistoryDetail
EKET_PurchaseOrderScheduleLinesDetail
EKKO_PurchaseOrderHeaderDetail
EKPO_PurchaseOrderItemDetail
FINSC_BTTYPE_T_BusinessTransactionTypeDescription
FINSC_LEDGER_T_JournalLedgerDescription
LFA1_SupplierMasterDetails
LFB1_SupplierMasterCompanyCodeDetails
MARA_MaterialMaster
MATDOC_MaterialMovementDetails
MKPF_MaterialMovementHeaderDetail
MSEG_MaterialMovementItemDetail
RBKP_InvoiceReceiptHeaderDetail
RSEG_IncomingInvoiceItemDetail
T001_CompanyCodes
T001_CompanyCodes
T001K_ValuationAreaDetails
T001L_MaterialStorageLocation
T001W_PlantDetails
T002T_LanguageKeyDescription
T003T_AccountingDocumentTypeDescription
T005_CountryMaster
T006A_UnitOfMeasure
T007S_PurchaseSalesTaxCodeDescription
T023T_MaterialGroupDescription
T024_PurchasingGroupsDetails
T024E_PurchasingOrganizationsDetails
T024W_PlantPurchasingOrganizationsDetails
T156HT_MaterialMovementTypeDescription
T161T_PurchasingDocumentTypeDescription
T163M_ConfirmationCategoryDescription
T16FE_PurchaseDocumentReleaseIndicatorDescription
TBSLT_PostingKeyDescription
TCURT_CurrencyCodesText
TKA01_ControllingAreaMaster
配置维度层流水线
您可以从源 SAP 表中提取 KPI。如需准备数据以供分析,请对源表中的数据进行整理,使其与 BigQuery 表的架构结构匹配。
加速器会创建以下示例表:
表名称 | 表的说明 |
---|---|
Supplier_dimension |
供应商及其相关事实(例如供应商一般信息和供应商销售相关信息)的精选列表*。 |
Material_dimension |
物料及其关联事实(例如 SKU 编号、产品层次结构和分类)的精选列表。 |
Purchase_Order_Fact |
采购订单列表,其中包括采购组织、群组和订单类型。 |
Goods_Receipt_Fact |
商品接收的精选列表,包括利润中心和移动类型信息。 |
Invoice_Fact |
账单相关信息精选列表,包括账单类型、商品数量、价值以及账单过账日期。 |
Accounting_Fact |
每个采购订单订单项的会计过账精选列表。 |
*在此上下文中,精选列表来自应用于所选列列表的业务逻辑。
加速器使用 SQL 脚本构建 BigQuery 数据集的维度层,您可以根据项目进行修改。例如,您可以调整这些脚本以向目标 BigQuery 数据集实体添加更多列。
为架构加注星标的转换:BigQuery 执行程序流水线名称
Cloud Data Fusion 中的以下 BigQuery 执行程序流水线会将数据加载到维度表和事实表中:
所有维度转换流水线:
Supplier_dimension
Material_dimension
Purchase_Order_Fact
Goods_Receipt_Fact
Invoice_Fact
Accounting_Fact
BigQuery 执行程序配置
宏名称 | 示例 |
---|---|
${ProjectID} |
sap_adaptor |
${StagingDatasetName} |
sap_cdf_staging |
${TargetDatasetName} |
sap_cdf_dimension |
将 Looker 连接到 BigQuery 项目
如需将 Looker 连接到 BigQuery,请参阅有关 BigQuery 连接的 Looker 文档。
安装块
您可以在 GitHub 上访问 SAP Looker 块。
Looker 块安装了具有两个探索环境和两个信息中心的预配置 LookML 模型。
后续步骤
- 详细了解 Cloud Data Fusion。
- 详细了解 SAP on Google Cloud。
- 详细了解 BigQuery。
- 详细了解 Looker 块。