版本 1:Google Cloud 的 Agent for SAP 规划指南

为了提供支持和进行监控,Google Cloud 为在 Compute Engine 虚拟机实例和裸金属解决方案服务器上运行的 SAP 工作负载提供 Agent for SAP

根据 SAP 的要求,为了从 SAP 获取支持以及让 SAP 能够满足其服务等级协议 (SLA),您必须在运行任何 SAP 系统的所有 Compute Engine 虚拟机实例和裸金属解决方案服务器上安装 Google Cloud 的 Agent for SAP。如需详细了解支持前提条件,请参阅“SAP 说明 2456406 - Google Cloud Platform 上的 SAP:支持前提条件”

Google Cloud 的 Agent for SAP 版本 1 是 Google Cloud 的 SAP NetWeaver 监控代理版本 2 的后续版本。除了必须收集的 SAP Host Agent 指标之外,在 Linux 上,Google Cloud 的 Agent for SAP 还包含一些可选功能,例如收集 Process Monitoring 指标和 Workload Manager 评估指标。您可以选择启用这些功能,以便为 SAP 工作负载启用产品和服务(例如 Workload Manager)。

对于在裸金属解决方案服务器上运行的 SAP 系统,当运行连接到以下任何数据库的 SAP NetWeaver 时,都需要使用 Google Cloud 的 Agent for SAP:

  • SAP HANA
  • SAP Adaptive Server Enterprise (ASE)
  • SAP MaxDB
  • IBM Db2

您在安装了 SAP 系统的主机上安装 Google Cloud 的 Agent for SAP。如需了解如何安装和配置代理、验证安装,以及验证代理按预期运行,请参阅:

如果您使用 Google Cloud 提供的以下 RHEL 或 SLES“for SAP”操作系统映像,则 Google Cloud 的 SAP for Agent 会与操作系统映像打包在一起:

  • RHEL:所有“for SAP”映像
  • SLES:SLES 15 SP4 for SAP 及更高版本

代理收集的指标

Google Cloud 的 Agent for SAP 版本 1 支持收集以下指标:

SAP Host Agent 指标

SAP Host Agent 指标收集功能默认处于启用状态。Google Cloud 的 Agent for SAP 会收集 SAP 要求的所有必需信息,并将其发送到 SAP Host Agent,包括以下指标:

  • CPU,例如 CPU 利用率。
  • 永久性磁盘存储,例如磁盘吞吐量和延迟时间。
  • 内存,例如内存消耗量。
  • 网络,例如网络带宽。
  • 配置,包括有关主机及其环境的信息。

Google Cloud 的 Agent for SAP 收集的指标由 SAP 决定。如需了解代理收集的指标,请参阅 SAP 说明 2469354 - IaaS 基础架构上的 SAP 的关键监控指标

Process Monitoring 指标

在 Linux 上,Google Cloud 的 Agent for SAP 可以收集 SAP 应用及其运行时状态的 Process Monitoring 指标。Process Monitoring 指标中收集的信息可帮助您排查与 SAP 系统相关的问题。如果出现问题,Cloud Customer Care 可以借助 Process Monitoring 指标帮助您更高效地解决问题。

Process Monitoring 指标收集是一项可选功能,您可以在安装 Google Cloud 的 Agent for SAP 后启用它。如需了解启用 Process Monitoring 指标收集功能的步骤,请参阅在 Linux 上配置 Google Cloud 的 Agent for SAP

Process Monitoring 指标是快速变化的指标,默认情况下每 5 秒收集一次。

使用 Process Monitoring 指标收集的数据会提供 SAP HANA 高可用性集群配置的可观测性。为了实现可观测性并根据指标阈值设置提醒,您需要安装 Google Cloud 提供的自定义信息中心。如需详细了解信息中心设置,请参阅查看收集的指标

下表介绍了代理收集的 Process Monitoring 指标。此表中的指标字符串必须以 workload.googleapis.com/ 为前缀。下表中的条目省略了此前缀。

指标 类别 说明
sap/hana/service SAP HANA 表示 SAP HANA 服务可用性的数字响应代码。
  • 0:服务未运行
  • 1:服务正在运行
sap/hana/ha/replication SAP HANA 表示 SAP HANA 系统复制的数字响应代码,基于 SAP 系统 ID、SAP 实例编号和 SAP 服务名称。
  • 0:出现错误。
  • 10:复制已关闭(独立模式)。
  • 12:复制正在进行中。当前节点为辅助节点。
  • 15:复制正在进行中。初始化或与主实例的同步已完成,辅助实例会持续复制。
sap/hana/availability SAP HANA 表示 SAP HANA 系统可用性的数字响应代码,基于 SAP 系统 ID 和 SAP 实例编号。
  • 0:一个或多个进程未处于活跃状态
  • 1:所有进程都处于活跃状态
sap/hana/ha/availability SAP HANA 表示 SAP HANA 系统高可用性状态的数字响应代码,基于 SAP 系统 ID 和 SAP 实例编号。
  • 0:未知状态
  • 1:当前节点是辅助节点
  • 2:主节点有错误
  • 3:主节点处于在线状态,但复制未完全正常运行
  • 4:主节点处于在线状态,并且复制正在运行
sap/hana/query/state SAP HANA 表示 SAP HANA 健康检查的数字响应代码,基于查询 select * from dummy。 值 0 表示成功。任何其他值都表示失败。
sap/hana/query/overalltime SAP HANA 仅在 query/state0 时报告。这是查询所花费的总时间,包括客户端时间和服务器端时间(以微秒为单位)。
sap/hana/query/servertime SAP HANA 仅在 query/state0 时报告。这是服务器处理查询所花费的时间(以微秒为单位)。
sap/cluster/failcounts SAP HANA Linux 高可用性资源的失败计数值。如果该资源不存在,则表示未注册失败计数。否则,集群监控 crm_mon 会报告失败操作次数。
sap/cluster/nodes Pacemaker 集群 表示 Linux 高可用性集群状态的数字响应代码。
  • -10:未知
  • -1:异常状态
  • 0:关停
  • 1:备用
  • 2:在线
sap/cluster/resources Pacemaker 集群 表示 Linux 高可用性集群资源是否已启动且正在运行的数字响应代码。
  • -10:未知
  • 0:失败
  • 1:已停止
  • 2:正在启动
  • 3:资源处于以下稳定状态之一:MasterSlaveStarted
sap/nw/availability SAP NetWeaver 表示 SAP NetWeaver 系统可用性的数字响应代码,基于 SAP 系统 ID、SAP 实例编号和 SAP 服务名称。
  • 0:未知状态
  • 1:当前节点处于活跃状态或已启动
sap/nw/service SAP NetWeaver 表示 SAP NetWeaver 服务可用性的数字响应代码,基于 SAP 系统 ID、SAP 实例编号和 SAP 服务名称。
  • 0:服务未运行
  • 1:服务正在运行
sap/nw/icm/rcode SAP NetWeaver 基于未经身份验证的 ICM 网址资源(本地调用)的 HTTP 1.1 协议的响应代码。
sap/nw/icm/rtime SAP NetWeaver 未经身份验证的 ICM 网址资源(本地调用)的响应时间(以毫秒为单位)。
sap/nw/ms/rcode SAP NetWeaver 基于未经身份验证的消息服务器网址资源(本地调用)的 HTTP 1.1 协议的响应代码。
sap/nw/ms/rtime SAP NetWeaver 未经身份验证的消息服务器网址资源(本地调用)的响应时间(以毫秒为单位)。
sap/nw/ms/wp SAP NetWeaver 消息服务器信息页面报告的 ABAP 工作进程 (NW ABAP) 或 Java 服务器节点 (NW Java) 的数量。
sap/nw/abap/proc/busy SAP NetWeaver 繁忙 ABAP 工作进程数(按类型,例如 DIA、ICM 和 DISP)。
sap/nw/abap/proc/count SAP NetWeaver 所有 ABAP 工作进程数(按类型,例如 DIA、ICM 和 DISP)。
sap/nw/abap/queue/current SAP NetWeaver ABAP 工作进程当前使用的 ABAP 队列数量(按 DIA、ICM、DISP 等工作进程类型分组)。
sap/nw/abap/queue/peak SAP NetWeaver ABAP 工作进程使用的 ABAP 队列的峰值数量(按 DIA、ICM、DISP 等工作进程类型分组)。
sap/nw/abap/sessions SAP NetWeaver ABAP 会话数(按会话类型)。
sap/nw/abap/rfc SAP NetWeaver ABAP RFC 连接数(按会话类型)。
sap/nw/enq/locks/usercountowner SAP NetWeaver SAP NetWeaver 系统中的排队锁定数。如果您的系统有许多打开的锁定条目,则可能会导致用户遇到性能问题。
sap/mntmode 其他 SAP 指标 相应 SAP 系统 ID (SID) 的维护模式,该模式已手动设置以指示系统有意地停机 (maintenancemode = TRUE)。此指标的值用于禁止对计划内维护期间不可用的系统发出提醒。

如需在特定 SID 正在进行计划内维护时通知代理,请运行以下命令:

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed 其他 SAP 指标 指示与 SAP 和集群服务相关的操作系统服务是否失败。退出代码 0 表示失败。
sap/service/is-disabled 其他 SAP 指标 pacemakercorosyncsapconfsaptunesapinit 服务未启用时,系统会填充此指标。
sap/hana/cpu/utilization 其他 SAP 指标 SAP HANA 进程每个进程的 CPU 利用率 (%)。
sap/nw/cpu/utilization 其他 SAP 指标 SAP NetWeaver 进程每个进程的 CPU 利用率 (%)。
sap/control/cpu/utilization 其他 SAP 指标 SAP 控制进程每个进程的 CPU 利用率 (%)。
sap/hana/memory/utilization 其他 SAP 指标 HANA 进程每个进程的内存利用率 (MB)。
sap/nw/memory/utilization 其他 SAP 指标 NetWeaver 进程每个进程的内存利用率 (MB)。
sap/control/memory/utilization 其他 SAP 指标 SAP 控制进程每个进程的内存利用率 (MB)。
sap/infra/migration Google Cloud 基础架构指标 指示虚拟机实例是否正在进行实时迁移
sap/agent/health SAP 代理指标 指示代理是否正在运行:
  • true 指示代理处于活跃状态且正在运行。
  • false 指示代理未运行。
sap/agent/cpu/utilization SAP 代理指标 SAP 守护进程代理的 CPU 利用率。
sap/agent/memory/utilization SAP 代理指标 SAP 守护进程代理的内存利用率。

Workload Manager 评估指标

在 Linux 上,Google Cloud 的 Agent for SAP 可以收集 Workload Manager 评估指标,用于为您的 SAP 工作负载启用 Workload Manager 服务。在 Workload Manager 评估指标中收集的信息可帮助您检查 SAP 应用、数据库和高可用性配置的配置和设置。

Workload Manager 评估指标收集是一项可选功能,您可以在安装 Google Cloud 的 Agent for SAP 后启用它。如需了解启用 Workload Manager 评估指标收集功能的步骤,请参阅在 Linux 上配置 Google Cloud 的 Agent for SAP

Workload Manager 评估指标是缓慢变化的指标,默认情况下每 5 分钟收集一次。

下表介绍了代理收集的 Workload Manager 评估指标。此表中的指标字符串必须以 workload.googleapis.com/ 为前缀。下表中的条目省略了此前缀。

指标 类别 说明
sap/validation/system Workload Manager 数字指标,始终为 1
sap/validation/corosync Workload Manager 在实例上找到的 corosync 配置的数字指标:
  • 0:找不到 corosync 配置
  • 1:已找到 corosync 配置
sap/validation/pacemaker Workload Manager 在实例上找到的 pacemaker 配置的数字指标:
  • 0:找不到 pacemaker
  • 1:已找到 pacemaker 配置
sap/validation/hana Workload Manager 在实例上找到的 SAP HANA 的数字指标:
  • 0:找不到 SAP HANA
  • 1:已找到 SAP HANA
sap/validation/netweaver Workload Manager 在实例上找到的 SAP NetWeaver 的数字指标:
  • 0:找不到 SAP NetWeaver
  • 1:已找到 SAP NetWeaver

价格

Google Cloud 的 Agent for SAP 可以免费安装和运行。但是,您需负责在 Cloud Monitoring 中读取和写入数据所产生的费用。

对于代理收集的指标,Monitoring 会根据以下各项收费:

  • 超出每月免费 API 配额的 Monitoring API 读取调用次数。
  • 当提取的指标数据超出每月免费指标配额时,按提取的字节数衡量的指标。

在 Monitoring 中,注入是指将时序写入 Monitoring 的过程。每个时序都包含一定数量的数据点;这些数据点是注入费用的基础。如需了解价格信息,请参阅 Monitoring 价格

如需了解 Monitoring 中的一般概念,请参阅指标、时序和资源

每月费用估算

本部分介绍了如何针对按 API 读取调用次数和注入字节数计费的指标估算收集指标数据的每月费用。

此部分中的示例展示的是截至 2022 年 12 月的 Monitoring 价格。这些示例旨在说明计算方式;如需进行全面的估算,请使用价格计算器

下表汇总了代理的一些必需功能和可选功能的每月估算费用。如需了解费用估算的详细步骤,请参阅 SAP Host Agent 指标Process Monitoring 指标Workload Manager 评估指标

特征 类型 虚拟机实例数量 费用 ($)
SAP Host Agent 指标收集 必需 100 $209
Process Monitoring 指标收集 可选 100 $1,513.17
Workload Manager 评估指标收集 可选 500 $4.41

按 API 读取调用次数计费的指标的价格示例

以下示例说明了如何针对按 API 读取调用次数计费的指标(例如 SAP Host Agent 指标)估算收集指标数据的费用。

SAP Host Agent 指标

设想一个场景,您有一定数量的 Compute Engine 虚拟机实例,这些实例每月进行一定次数的 API 读取调用。此场景中的变量包括:

  • 虚拟机实例发出 API 读取调用的速率。
  • Compute Engine 虚拟机实例的数量。

对于此费用估算,假设一个月约有 43,800 分钟。

60 * 730 小时(365 天 / 12 个月 * 24 小时)

假设虚拟机实例以 5 次调用 / 分钟的速率进行 API 读取调用。

对于一个虚拟机实例,一个月以 5 次调用 / 分钟的速率进行的 API 读取调用总次数:219,000 (43,800 * 5)

假设您有 100 个虚拟机实例。

  • 每月 API 读取调用总次数:21,900,000

    (219,000 * 100)

  • 免费配额用尽后的每月 API 读取调用次数:20,900,000

    (21,900,000 - 1,000,000 = 20,900,000)

  • 100 个虚拟机实例的每月大概费用:$209

    (20,900,000 / 1000) * 0.01

读取次数 费率($/1000 次读取) 费用 ($)
每月免费配额 100 万 0.00 $0.00
应收款 20,900,000 0.01 $209
总计 21,900,000 $209

按注入的字节数计费的指标的价格示例

以下示例说明了如何针对按注入字节数计费的指标(例如 Process Monitoring 指标和 Workload Manager 评估指标)估算收集指标数据的费用。

Process Monitoring 指标

设想一个场景,您有一定数量的 Compute Engine 虚拟机实例,这些实例每月写入一定数量的指标数据。此场景中的变量包括:

  • 指标数据写入速率。
  • 指标数量。
  • Compute Engine 虚拟机实例的数量。

对于此费用估算,假设一个月约有 43,800 分钟。

60 * 730 小时(365 天 / 12 个月 * 24 小时)

对于一个指标,一个月以 1 个数据点 / 5 秒的速率写入数据,即 12 个数据点 / 分钟

  • 数据点总数:525,600(43,800 分钟 * 12 个数据点)
  • 总提取量:
    • 4,204,800 字节(525,600 个数据点 * 8 个字节)
    • 4.01000977 MiB(4,204,800 个字节 / 1,048,576 个字节/MiB)

假设您有 100 个虚拟机实例,每个实例写入 15 个指标。

  • 每月总注入量:6,015.01466 MiB

    一个指标 4.01000977 MiB * 1500(100 个虚拟机实例 * 15 个指标)

  • 100 个虚拟机实例的每月大概费用:$1,513.17

    (6,015.01466 - 150) * 0.258

提取的 MiB 数量 费率 ($/MiB) 费用 ($)
每月免费配额 150 0.00 $0.00
应收款 5,865.01466 0.258 $1,513.17
总计 6,015.01466 $1,513.17

Workload Manager 评估指标

设想一个场景,您有一定数量的 Compute Engine 虚拟机实例,这些实例每月写入一定数量的指标数据。此场景中的变量包括:

  • 指标数据写入速率。
  • 指标数量。
  • Compute Engine 虚拟机实例的数量。

对于此费用估算,假设一个月约有 43,800 分钟。

60 * 730 小时(365 天 / 12 个月 * 24 小时)

对于一个指标,一个月以 1 个数据点 / 300 秒的速率写入数据,即 0.2 个数据点 / 分钟

  • 数据点总数:8,760(43,800 分钟 * 0.2 个数据点)
  • 总提取量:
    • 70,080 字节(8,760 个数据点 * 8 个字节)
    • 0.0668335 MiB(70,080 个字节 / 1,048,576 个字节/MiB)

假设您有 500 个虚拟机实例,每个实例写入 5 个指标。

  • 每月总注入量:167.08375 MiB

    一个指标 0.0668335 MiB * 2500(500 个虚拟机实例 * 5 个指标)

  • 500 个虚拟机实例的每月大概费用:$4.41

    (167.08375 - 150) * 0.258

提取的 MiB 数量 费率 ($/MiB) 费用 ($)
每月免费配额 150 0.00 $0.00
应收款 17.08375 0.258 $4.41
总计 167.08375 $4.41

支持的操作系统

Google Cloud 的 Agent for SAP 支持 SAP NetWeaver 和 SAP HANA 所支持的所有操作系统。如需了解详情,请参阅 SAP NetWeaver 支持的操作系统列表SAP HANA 支持的操作系统列表

身份验证和访问权限

Google Cloud 的 Agent for SAP 需要使用 Identity and Access Management (IAM) 服务账号,以便向 Google Cloud 进行身份验证并获得访问 Google Cloud 资源的权限。

分配给该服务账号的 IAM 角色决定了此代理有权与哪些 Google Cloud 资源进行交互。

除非您使用现有或默认服务账号,否则您需要在 Google Cloud 项目中创建服务账号,并为服务账号分配一个或多个角色。

指定服务账号

如果代理在 Compute Engine 虚拟机上运行,则代理默认使用主机虚拟机的服务账号。主机虚拟机服务账号通常是您或您的某个同事创建的角色受限的服务账号,但它也可以是 Compute Engine 默认服务账号,该账号默认拥有广泛的权限。

如果代理在裸金属解决方案服务器上运行,则您需要使用 JSON 服务账号密钥创建服务账号。如需了解详情,请参阅设置服务账号

如需详细了解服务账号、角色和权限,请参阅:

所需 IAM 角色

无论您是使用新服务账号、现有服务账号还是默认服务账号,该服务账号都必须具有向代理授予所需权限的角色。

对于在虚拟机实例上收集 SAP Host Agent 指标,预定义 IAM 角色 Compute Viewer (roles/compute.viewer) 会授予获取和列出 Compute Engine 资源的权限,但无法读取这些资源中存储的数据。此外,预定义 IAM 角色 Monitoring Viewer (roles/monitoring.viewer) 会授予查看 Monitoring 数据的权限。

对于在裸金属解决方案服务器上收集 SAP Host Agent 指标,代理不会访问 Google Cloud API,因此不需要 IAM 服务账号或权限。

对于 Process Monitoring 指标和 Workload Manager 评估指标,除了 Compute Viewer (roles/compute.viewer)Monitoring Viewer (roles/monitoring.viewer) 角色之外,预定义 IAM 角色 Monitoring Metric Writer(roles/monitoring.metricWriter) 还会授予将指标写入 Monitoring 的权限。

对于收集 SAP HANA 的 Process Monitoring 指标,如果您使用 Secret Manager,则预定义角色 Secret Manager Secret Accessor (roles/secretmanager.secretAccessor) 会授予访问 Secret Manager 中存储的 Secret 的权限。

针对 Google Cloud API 的访问权限

Compute Engine 建议将虚拟机实例配置为允许对所有 Cloud API 的完整访问权限,并且仅使用实例服务账号的 IAM 权限来限制对 Google Cloud 资源的访问。如需了解详情,请参阅创建使用用户管理的服务账号的虚拟机

如果您限制虚拟机实例对 Cloud API 的访问权限,则对于 SAP Host Agent 指标,Google Cloud 的 Agent for SAP 要求主机虚拟机实例具有以下最小 Cloud API 访问权限范围:

  • Compute Engine:只读
  • Stackdriver Monitoring API:只读

对于 Process Monitoring 指标和 Workload Manager 评估指标,主机虚拟机实例的访问权限范围必须具有向 Google Cloud 项目发布指标数据的写入权限。当您创建新的 Compute Engine 虚拟机实例时,系统会自动为其配置写入权限范围 https://www.googleapis.com/auth/monitoring.write

如果代理未在 Compute Engine 虚拟机上运行,则您需要建立与 Google Cloud API 的连接。如需了解详情,请参阅配置适用于本地主机的专用 Google 访问通道

Monitoring 中的指标

对于 Process Monitoring 指标和 Workload Manager 评估指标,Google Cloud 的 Agent for SAP 会将其从 SAP 系统检索的数据作为自定义指标数据发送到 Monitoring。为了发送数据,此代理会使用 Monitoring API,该 API 在创建 Google Cloud 项目时默认处于启用状态。

如需简要了解 Monitoring,请参阅 Monitoring 简介

在 Monitoring 中查找指标数据

一旦 Monitoring 收到来自 Google Cloud 的 Agent for SAP 的指标数据,您就可以立即查看这些数据。如需查找并直观呈现收集的数据,您可以使用 Metrics Explorer。如需详细了解如何在 Monitoring 中查找指标数据,请参阅 Google Cloud 的 Agent for SAP 操作指南

如需详细了解如何在 Monitoring 中直观呈现收集的数据,请参阅:

GitHub 上的信息中心定义

在 GitHub 上,您可以找到可在 Google Cloud 项目中安装的 SAP HANA 的自定义信息中心定义。 请参阅 GitHub 上 GoogleCloudPlatform/monitoring-dashboard-samples 代码库中的 dashboards/google-cloud-agent-for-sap 目录。

如需了解这些信息中心(包括安装说明),请参阅查看收集的指标

提醒通知

如需在指标达到您定义的阈值时收到提醒,您可以在 Monitoring 中配置提醒通知。

如需了解详情,请参阅提醒简介

自动安装

当您使用 Google Cloud 提供的 Terraform 配置文件或 Deployment Manager 模板来自动部署 Google Cloud 基础架构时,Google Cloud 的 Agent for SAP 会在部署过程中自动进行安装,以用于 SAP 所要求的指标收集。

如需了解如何手动安装和配置 Google Cloud 的 Agent for SAP,请参阅:

GitHub 上的 Google Cloud 的 Agent for SAP 代码库

如需了解企业的安全要求,您可以根据需要查看 Google Cloud 的 Agent for SAP 的源代码。此代理的代码库可在 GoogleCloudPlatform/sapagent 下的只读 GitHub 代码库 google-cloud-sap-agent 中获得。

支持

如有 Google Cloud 基础架构或服务方面的问题,请与 Customer Care 联系。您可以在 Google Cloud 控制台中的“支持概览”页面上找到联系信息。如果 Customer Care 确定问题在于您的 SAP 系统,会将您引荐给 SAP 支持。

对于与 SAP 产品有关的问题,请通过 SAP 支持记录您的支持请求。 SAP 会评估支持服务工单,如果该问题似乎是 Google Cloud 基础架构问题,则将工单转移到 Google Cloud 组成团队 BC-OP-LNX-GOOGLEBC-OP-NT-GOOGLE

支持要求

您必须满足最低支持方案要求,才能获得对 SAP 系统及其使用的 Google Cloud 基础架构和服务的支持。

如需详细了解 Google Cloud 上的 SAP 的最低支持要求,请参阅:

后续步骤