本页面介绍了如何监控集群,以确保它们按预期运行。
本页还包含使用 Memorystore for Redis Cluster 和 Cloud Monitoring 监控集群的示例。此外,Memorystore for Redis Cluster 还与开源 Redis 兼容。因此您可以通过 Compute Engine 虚拟机使用现有 Redis 监控工具来监控集群。
使用 Memorystore for Redis Cluster 监控集群
您可以使用“系统洞见”信息中心查看集群的集群级和节点级监控指标。此信息中心会显示与所选集群或节点相关的图表,并提供内存利用率、CPU 利用率、接收的连接数、缓存命中率、调用总数和其他性能指标的衡量值。通过查看集群或节点可用的指标,您可以检测和分析系统性能问题。
准备工作
您需要拥有 Identity and Access Management (IAM) 角色和权限,才能使用“系统概览”信息中心。
IAM 角色
如需查看或修改“系统数据分析”信息中心(包括自定义信息中心以满足您的需求),您的管理员必须为您授予 Google Cloud 项目的以下 IAM 角色:
- 如需创建和修改自定义信息中心,请使用:Monitoring Dashboard Configuration Editor (
roles/monitoring.dashboardEditor
) - 如需打开并查看自定义信息中心,请使用:Monitoring Dashboard Configuration Viewer (
roles/monitoring.dashboardViewer
) - 如需检索监控指标的数据,并在“系统概览”信息中心内过滤数据,请使用以下角色:Monitoring Viewer (
roles/monitoring.viewer
) - 如需创建和修改 Metrics Explorer 提醒,您需要具备以下权限:Monitoring Editor (
roles/monitoring.editor
)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
这些预定义角色包含过滤数据以及在“系统概览”信息中心内创建、查看和修改自定义设置所需的权限。如需详细了解所需的具体权限,请参阅 IAM 权限。
IAM 权限
您需要具备以下权限才能过滤数据,以及在“系统分析洞见”信息中心上创建、查看和修改自定义设置:
- 如需过滤信息中心内的数据,请执行以下操作:
monitoring.metricDescriptors.list
和monitoring.monitoredResourceDescriptors.list
- 如需在信息中心内创建自定义内容,请执行以下操作:
monitoring.dashboards.create
- 如需查看信息中心内的自定义设置,请点击
monitoring.dashboards.get
和monitoring.dashboards.list
- 如需修改信息中心内的自定义设置,请执行以下操作:
monitoring.dashboards.update
图表和指标简介
系统分析洞见信息中心提供图表和指标,用于展示集群的当前状态和历史状态。大多数图表和指标均适用于集群级层。您还可以查看集群中单个节点的图表和指标。
系统会列出每个图表的指标类型。指标类型字符串具有此前缀:redis.googleapis.com/cluster
。指标类型描述了可以从受监控的资源中收集的测量结果。
集群
下表说明了系统数据分析信息中心默认显示的集群图表。
图表名称 | 指标类型 | 说明 |
---|---|---|
内存利用率 | /memory/average_utilization
/memory/maximum_utilization |
集群使用的总内存。在双区域集群或多区域集群中,该指标表示各区域的平均内存利用率。 |
CPU 利用率 | /cpu/average_utilization
/cpu/maximum_utilization |
集群使用的 CPU 总量。如果集群在多个区域中可用,则此指标表示各个区域的平均 CPU 利用率。 |
已连接的客户端 | /clients/total_connected_clients |
当前与集群建立的客户端连接数。 |
缓存命中率 | /stats/total_keyspace_hits_count
/stats/total_keyspace_misses_count |
整个集群中键查找成功的总次数与键查找失败的总次数和键查找成功的总次数之和的比率(命中次数/命中次数 + 未命中次数)。 |
通话 | /commandstats/total_calls_count |
与某个命令相关联的通话在一分钟内的总次数。 |
执行时间 - 主要 - 命令 | /commandstats/total_calls_count
/commandstats/total_usec_count |
Memorystore for Redis Cluster 在集群主节点上运行读取和写入命令所用的总时间与命令总数的比率。您可以使用此图表中的菜单来过滤,以仅显示读取命令、仅显示写入命令,或同时显示读取命令和写入命令。 |
执行时间 - 副本 - 命令 | /commandstats/total_calls_count
/commandstats/total_usec_count |
Memorystore for Redis 集群在集群的副本节点上运行读取和写入命令所用的总时间与命令总数的比率。您可以使用此图表中的菜单来过滤,以仅显示读取命令、仅显示写入命令,或同时显示读取命令和写入命令。 |
节点
下表说明了系统数据分析信息中心默认显示的节点图表。
图表名称 | 指标类型 | 说明 |
---|---|---|
内存利用率 | /node/memory/utilization |
集群节点使用的内存量。 |
CPU 利用率 | /node/cpu/utilization |
集群的节点使用的 CPU 量。 |
已连接的客户端 | /node/clients/connected_clients |
连接到集群节点的客户端数量。 |
缓存命中率 | /node/stats/keyspace_hits_count
/node/stats/keyspace_misses_count |
键查找成功总次数与键查找失败总次数和键查找成功总次数之和的比率(命中次数/命中次数 + 未命中次数)。 |
各节点的关键性能指标窗格简介
您可以使用此窗格查看集群的主节点和副本节点的以下信息:
- CPU 利用率 (
/node/cpu/utilization
):集群中每个节点在您于“系统概览”信息中心内指定的时间范围内的平均 CPU 使用量。 - 内存利用率 (
/node/memory/utilization
):每个集群节点在指定时间范围内的平均内存用量。 - 节点正常运行时间 (
/node/server/uptime
):每个集群节点在指定时间范围内的正常运行时间。 Memorystore for Redis Cluster 会将此时间与之前最接近的已知时间保持一致。
如需详细了解如何以最佳方式使用 Memorystore for Redis Cluster(包括 CPU 利用率、内存利用率和节点正常运行时间),请参阅 Memorystore for Redis Cluster 最佳实践。
查看集群级监控指标
您可以使用“系统概览”信息中心查看集群级监控指标。这些指标以图表形式显示,可用于衡量内存利用率、CPU 利用率、接收的连接数、缓存命中率和调用总数。
如需查看集群级监控指标,请按照以下步骤操作:
在 Google Cloud 控制台中,前往 Memorystore for Redis 集群页面。
点击要监控的集群的 ID。
在侧边导航栏中,点击系统分析洞见。
可选。您可以自定义信息中心,以满足您的需求。
查看节点级监控指标
您可以使用“系统概览”信息中心查看节点级监控指标。这些指标以图表的形式显示,可用于衡量内存利用率、CPU 利用率、接收的连接数、缓存命中率和调用总数。
如需查看节点级监控指标,请按以下步骤操作:
在 Google Cloud 控制台中,前往 Memorystore for Redis 集群页面。
点击要监控的集群的 ID。
在侧边导航栏中,点击系统分析洞见。
点击节点标签页。在信息中心内,系统会显示集群节点的各节点的关键性能指标窗格和图表。
如需详细了解如何使用这些图表,请参阅使用图表和指标。如需详细了解如何使用该窗格,请参阅使用各节点的关键性能窗格。
使用图表和指标
系统分析洞见信息中心上显示的每个图表都有一个工具栏,其中提供以下标准选项。除非您将指针悬停在图表上,否则某些元素会处于隐藏状态。
如需放大图表的某个部分,请将指针拖动到您要查看的部分。此操作会设置自定义时间范围,您可以使用时间范围过滤条件调整或恢复此范围。如需缩小该部分,请点击重置缩放级别。
如需查看图表及其数据的说明,请点击帮助 (help)。
如需查看 Memorystore for Redis Cluster 应用于图表的过滤条件和分组,请点击信息图标 (info)。
如需根据图表的数据创建提醒,请点击创建提醒政策 (add_alert)。
如需探索图表中的数据,请点击探索数据 (query_stats)。
如需查看其他图表选项,请点击更多图表选项 (more_vert)。系统随即会显示一个菜单。
如需以全屏模式查看图表,请从菜单中选择全屏查看。如需退出全屏模式,请点击取消。
如需展开图表图例,请从菜单中选择展开图表图例。如需收起图例,请选择收起图表图例。
如需更改图表的视觉格式,请从菜单中选择模式,然后选择一种模式。此模式决定了图表显示数据的方式。
您可以选择三种模式:X 射线模式、颜色模式和统计信息模式。如需详细了解这些模式,请参阅设置 X 光、颜色或统计信息模式。
如需下载图表,请从菜单中选择下载,然后选择下载格式。您可以将图表下载为 PNG 或 CSV 文件。
如需在 Metrics Explorer 中查看相应指标,请从菜单中选择在 Metrics Explorer 中查看。在指标探索器中,您可以查看其他 Memorystore for Redis Cluster 指标。
使用“各节点的关键性能指标”窗格
该窗格包含一个工具栏,其中提供了以下标准选项。 除非您将指针悬停在窗格上,否则某些元素会处于隐藏状态。
如需探索窗格中的数据,请点击探索数据 (query_stats)。
如需以全屏模式查看窗格,请点击更多图表选项 (more_vert),然后从菜单中选择全屏查看。如需退出全屏模式,请点击取消。
如需微调窗格中显示的信息,请点击过滤条件字段,选择一个属性,然后选择一个值。例如,如需仅查看集群主节点的相关信息,请点击相应字段,选择角色属性,然后选择主值。
如需查看窗格及其数据的说明,请点击帮助 (help)。
如需选择窗格中显示的列,请点击列显示选项 (view_column)。
自定义系统分析洞见信息中心
预定义信息中心包含一组默认指标。您可以创建其他 widget,以添加 Memorystore for Redis Cluster 或其他Google Cloud 产品的其他指标,并从 Memorystore for Redis Cluster 中获得统一的监控视图。例如,如果您将 Memorystore for Redis 集群与 Google Kubernetes Engine (GKE) Enterprise 版 (GKE Enterprise) 搭配使用,则可以自定义预定义的信息中心。除了 Memorystore for Redis Cluster 指标之外,您还可以添加所需的 GKE Enterprise 指标,例如与 Pod 相关的指标。
创建自定义信息中心
如需创建自定义信息中心并向其中添加指标,请按以下步骤操作:
- 在“系统数据洞见”信息中心的集群或节点标签页中,选择预定义菜单,然后点击自定义信息中心。
- 在自定义视图名称字段中,输入信息中心的名称(例如,
my-custom-dashboard
)。 - 点击添加微件。
- 在添加 widget 窗格中,选择一个 widget 类型,以向信息中心添加指标。
在配置 widget 窗格中,配置 widget。
例如,在添加 widget 窗格中,您可以选择指标或堆叠条形图 widget,然后在配置 widget 窗格中,选择并配置 Memorystore for Redis 集群指标。
点击应用。您添加的 Memorystore for Redis Cluster 指标会显示在“系统概览”信息中心内。
点击保存。
修改自定义信息中心
如需修改您创建的自定义信息中心,请按以下步骤操作:
- 在“系统分析洞见”信息中心的集群或节点标签页中,点击修改信息中心 (edit)。
- 如需调整表示某个指标的微件的位置,请点击该微件的标题,然后将其拖动到新位置。
- 如需修改微件,请执行以下操作:
- 点击修改 widget (edit)。
- 在配置 widget 窗格中,修改 widget。
- 点击应用。
- 如需克隆 widget,请执行以下操作:
- 点击更多图表选项 (more_vert)。
- 从菜单中选择克隆 widget。
- 在克隆对话框中,输入要克隆的小组件的名称,选择要显示该小组件的信息中心(例如,当前的“系统分析洞见”信息中心),然后点击克隆。
- 如需删除 widget,请执行以下操作:
- 点击更多图表选项 (more_vert)。
- 从菜单中选择删除 widget。
- 在删除 widget 对话框中,点击删除。
- 点击保存。
删除自定义信息中心
如需删除自定义信息中心,请按以下步骤操作:
- 在“系统数据分析”信息中心的集群或节点标签页中,点击删除自定义信息中心 (delete)。
- 在确定要删除吗?对话框中,点击删除信息中心。
过滤系统分析洞见信息中心
默认情况下,系统洞察信息中心会显示您要监控的集群的所有主节点和副本节点的数据。如需微调此信息中心图表中显示的数据,您可以使用以下过滤条件:
- 节点 ID:指定哪些主节点和副本节点包含您希望显示的数据
- 节点角色:指定显示的数据是仅与主节点关联、仅与副本节点关联,还是与主节点和副本节点都关联
按节点 ID 过滤
如需按节点 ID 过滤“系统分析洞见”信息中心,请按以下步骤操作:
在“系统概览”信息中心的节点标签页中,复制包含您希望显示的数据的节点的 ID。为此,请使用各节点的关键性能指标窗格复制节点 ID。
选择节点 ID 菜单。
在对话框中,粘贴您复制的节点的 ID,选中节点 ID 旁边的复选框,然后点击 OK。
针对您复制的所有节点 ID 重复执行第 2 步和第 3 步。
按节点角色过滤
如需按节点角色过滤“系统分析洞见”信息中心,请按以下步骤操作:
在“系统分析洞见”信息中心的节点标签页中,选择节点角色菜单。
在对话框中,执行以下操作之一:
如果您希望系统概览信息中心内显示的数据与主节点和副本节点相关联,请选中全选复选框。
如果您希望数据仅与主要节点相关联,请选中主要复选框。
如果您希望数据仅与副本节点相关联,请选中副本复选框。
点击确定。
使用 Cloud Monitoring 监控集群
Cloud Monitoring 是一项监控服务,可让您查看集群的指标,例如平均连接客户端数。如需详细了解 Cloud Monitoring 提供的所有 Memorystore for Redis 集群指标,请参阅支持的监控指标。
注册 Cloud Monitoring
如需访问监控控制台,请点击Google Cloud 控制台导航窗格中的 Monitoring:
如需了解价格,请参阅 Cloud Monitoring 价格。
在 Google Cloud Observability 中查看集群内存利用率
如需查看集群内存利用率信息,请使用 Metrics Explorer:
前往 Google Cloud 控制台,登录并导航到具有集群的项目:
从左侧导航菜单中选择 Monitoring。
在 Monitoring 中,如果导航窗格未展开,请点击展开last_page。该按钮位于控制台的左下角。
如果导航窗格中显示 Metrics Explorer,请点击 Metrics Explorer。否则,请选择 Resources,然后选择 Metrics Explorer。
选择 Cloud Memorystore Redis 集群作为资源类型,选择 Redis 集群平均内存利用率作为指标。
设置内存用量的 Monitoring 警报
您可以在 Monitoring 中设置提醒,以便在平均内存利用率指标超出您设置的阈值时收到通知。
要为“已用内存”指标创建提醒,请执行以下操作:
在 Google Cloud 控制台中,选择 Monitoring,或使用以下按钮:
选择 Alerting > Create a Policy。
为 Used Memory 阈值添加条件:
- 使用选择指标下拉菜单,为 Cloud Memorystore Redis Cluster 资源选择 Redis 集群平均内存利用率指标。
- 点击下一步按钮。
配置提醒:
- 在配置触发条件部分中,选择每当违反时序时。
- 将阈值位置设置为高于阈值。
- 将阈值设置为您希望在内存使用率达到多少时收到通知。
- 点击下一步按钮。
在通知和名称部分,选择所需的通知渠道。
- 为提醒政策添加名称,例如“Redis 集群内存利用率提醒”
点击创建政策。
现在,只要违反阈值,您就会收到通知。
您可以从 Monitoring 界面中的提醒标签页访问此提醒政策。
查看 Memorystore for Redis Cluster 日志
Memorystore for Redis Cluster 会生成 Cloud Logging 捕获的日志。
查看审核日志
前往 Google Cloud 控制台中的 Logs Explorer 页面。
如需查看审核日志,请从资源下拉菜单中选择已审核的资源 > Cloud Redis > CloudRedisCluster。