监控 Cloud SQL 实例

本页面介绍了如何通过以下方式监控 Cloud SQL 实例:

使用 Cloud SQL 系统数据分析信息中心

Cloud SQL System Insights 信息中心可帮助您检测和分析系统性能问题。

如需了解详情,请参阅使用 System Insights 提高系统性能

使用 Cloud Monitoring 信息中心监控实例

Cloud Monitoring 为多个 Google Cloud 产品提供预定义的信息中心,包括默认的 Cloud SQL 监控信息中心。您可以使用此信息中心来监控主实例和副本实例的整体健康状况。您还可以创建自己的自定义信息中心,用于显示您感兴趣的数据。

设置提醒

您可以使用 Cloud Monitoring 为项目或指定实例设置提醒

例如,您可以设置在 Cloud SQL 实例的内存用量指标超过 80% 的阈值时将消息发送到特定电子邮件 ID 的提醒。

在 Cloud SQL 实例的概览页面上查看指标

在 Cloud SQL 实例的概览页面上查看 Cloud SQL 实例的一些关键指标,如下所示:

  1. 在 Google Cloud 控制台中,转到 Cloud SQL 实例页面。

    转到“Cloud SQL 实例”

  2. 如需打开实例的概览页面,请点击实例名称。
  3. 默认指标图表会显示在页面顶部。

  4. 可选:从图表下拉列表中选择其他指标。

    该图表显示所选指标的数据。

可用指标

用量图表可以帮助您在应用需要更改时主动做出响应。通过这些指标,您可以深入了解吞吐量和延迟时间的问题,以及实例使用费用。

指标说明
存储使用量 (GB)

您可以借助存储使用量指标来了解自己的存储费用。如需详细了解按存储使用量收取的费用,请参阅存储和网络价格

时间点恢复使用预写式日志记录 (WAL) 归档。对于启用了时间点恢复的新 Cloud SQL 实例,或在 Cloud Storage 中存储 WAL 日志的功能可用后启用时间点恢复的现有实例,日志不再存储在磁盘上,而是存储在与实例位于同一区域的 Cloud Storage 中。

如需查看实例的日志是否存储在 Cloud Storage 中,请检查实例的 bytes_used_by_data_type 指标。如果 archived_wal_log 数据类型的值为 0,则实例的日志存储在 Cloud Storage 中。

使用 PostgreSQL 客户端(例如 psqlpgAdmin)连接到实例的数据库后,请运行以下命令:show archive_command。如果有任何 WAL 归档在 Cloud Storage 中,您会看到 -async_archive -remote_storage

所有其他启用了时间点恢复的现有实例都会继续将其日志存储在磁盘上。在 Cloud Storage 中存储日志的更改会在之后生效。

时间点恢复中使用的预写式日志会连同其关联的自动备份自动删除,通常是在满足为 transactionLogRetentionDays 设置的值后删除。这是 Cloud SQL 为时间点恢复保留的事务日志的天数,Cloud SQL Enterprise Plus 版本为 1 到 35 天,Cloud SQL Enterprise 版本为 1 到 7 天。

如果没有事先启用时间点恢复,而对 Cloud SQL 实例恢复备份,那么您会丢失可用来实现时间点恢复的 WAL 日志。

对于在 Cloud Storage 中存储预写式日志的实例,日志存储在主实例所在的区域中。此日志存储(最长 7 天,即时间点恢复时长上限)不会为每个实例产生额外费用。

如果实例启用了时间点恢复,并且磁盘上的预写式日志大小导致实例出现问题,则停用时间点恢复并重新启用以确保新日志存储在与实例位于同一区域的 Cloud Storage 中。此操作会删除现有的预写式日志,因此您执行时间点恢复的时间不能早于您重新启用时间点恢复的时间。不过,虽然现有日志会被删除,但磁盘大小保持不变。

为避免出现意外的存储问题,我们建议您在使用时间点恢复时为所有实例启用存储空间自动扩容。仅当实例启用了时间点恢复且日志存储在磁盘上时,此建议才适用。

如需删除日志并恢复存储空间,您可以停用时间点恢复。但请注意,减少所使用的预写式日志不会缩小为实例预配的磁盘大小。

数据使用量包含在存储使用量指标中。在数据使用过程中,当有事务修改数据库时,Cloud SQL 会先复制这些数据,然后再修改原始数据。数据的副本是撤消数据

CPU 使用率

您可以使用此指标来监控实例是否有足够的 CPU 资源来满足应用的需求。如果这个值过高,那么您可以提高机器类型的规格,以便为实例提供更多的 CPU 容量。

内存用量

您的实例当前使用的内存量。

读取/写入操作次数

“读取次数”指标是通过磁盘(而非缓存)处理的读取操作的次数。您可以使用此指标来帮助了解您的实例大小是否适合您的环境。如果需要,您可以选择资源规模更大的机器类型,以通过缓存处理更多请求,并缩短延迟时间。

“写入次数”指标是对磁盘执行的写入操作次数。即使您的应用未处于活跃状态,也会生成写入活动,因为 Cloud SQL 实例大约每秒都会写入一个系统表(副本除外)。

入站/出站字节数(每秒字节数) 传入或传出实例的网络流量。

比较多个实例的指标

  1. 在 Google Cloud 控制台中,转到 Cloud SQL 实例页面。

    转到“Cloud SQL 实例”

  2. 在 Cloud SQL 实例页面中,通过选中实例名称左侧的复选框来选择要比较的实例,最多可以选择 5 个实例。
  3. 在右侧的信息面板上,选择监控标签页。
  4. 从指标下拉列表中,选择要用于比较实例的指标。

    您可以通过将鼠标指针放在图表上来查看特定时刻的数据。

后续步骤