Métricas de uso de CPU

En esta página, se describen las métricas de uso de CPU que proporciona Spanner. Puedes consulta estas métricas en la consola de Google Cloud y en la Consola de Cloud Monitoring.

Uso de CPU y prioridad de tareas

Spanner mide el uso de CPU según la fuente y la prioridad. de la tarea.

  • Fuente: el usuario o el sistema pueden iniciar una tarea.

  • Prioridad: La prioridad ayuda Spanner determina qué tareas se deben ejecutar primero. La prioridad de las tareas del sistema es predeterminada y no se puede configurar. Las tareas de usuario se ejecutan con prioridad alta, a menos que se especifique lo contrario. Muchas solicitudes de datos, como read y executeSql, te permiten especificar una prioridad más baja para la solicitud. Esto puede ser útil, por ejemplo, cuando ejecutas consultas por lotes, de mantenimiento o analíticas que no tienen SLO de rendimiento estrictos.

    En general, las tareas de mayor prioridad se ejecutarán antes que tareas de menor prioridad. Spanner permite que las tareas de alta prioridad pueden usar hasta el 100% de los recursos de CPU disponibles, tareas de menor prioridad. Si bien las tareas del sistema de menor prioridad pueden retrasarse a corto plazo, deben ejecutarse en algún momento. Por lo tanto, debes aprovisionar tu instancia con suficiente capacidad de procesamiento de manejar todas las tareas.

    Si no hay tareas de alta prioridad, Spanner usará hasta el 100%. de los recursos de CPU disponibles para completar tareas de menor prioridad más rápido. Los picos del uso en segundo plano no indican un problema. Las tareas de prioridad más baja pueden generar tareas de prioridad más alta, incluidas las tareas del usuario, casi al instante.

En la siguiente tabla, se muestran ejemplos para cada tarea:

Tareas del usuario Tareas del sistema
Prioridad alta Incluye solicitudes de datos, como leer o executeSql, en los que no se priorizan PRIORITY_HIGH una regla de firewall. Incluye la división de datos.
Prioridad media Incluye lo siguiente:
  • Solicitudes de datos en las que PRIORITY_MEDIUM es especificado
  • Las operaciones de lectura y escritura emitidas desde trabajos de Dataflow, como Importar y Exportar.
Incluye lo siguiente:
Prioridad baja Incluye las solicitudes de datos en las que PRIORITY_LOW es especificada. Incluye lo siguiente:
  • Reabastecimiento de un índice.
  • Reabastece una columna generada

Métricas disponibles

Spanner proporciona las siguientes métricas del uso de CPU:

  • Uso de CPU suavizado: Un promedio móvil del uso de CPU total, como un porcentaje de los recursos de CPU de la instancia, para cada base de datos. Cada dato es un promedio de las 24 horas anteriores. Usa esta métrica para crear alertas y analizar el uso de la CPU durante un período prolongado, por ejemplo, 24 horas. Puedes ver un gráfico para esta métrica en la consola de Google Cloud o en la Consola de Cloud Monitoring como Promedio móvil de 24 hora.

  • Uso de CPU por prioridad: El uso de CPU, como un porcentaje de los recursos de CPU de la instancia, agrupados por prioridad, tareas iniciadas por el usuario y tareas iniciadas por el sistema Usa esta métrica para crear alertas y analizar el uso de la CPU a un nivel alto. Puedes ver un gráfico para esta métrica en la la consola de Google Cloud o en la Consola de Cloud Monitoring.

  • Uso de CPU por tipo de operación: El uso de CPU, como un porcentaje de los recursos de CPU de la instancia, agrupados por operaciones iniciadas por el usuario, como lecturas, escrituras y confirmaciones Usa esta métrica para obtener un desglose detallado del uso de CPU y solucionar problemas, como se explica en Cómo investigar el uso alto de CPU. Puedes crear un gráfico para esta métrica en la consola de Cloud Monitoring.

    También puedes usar la consola de Cloud Monitoring para crear alertas de uso de de aplicaciones, como se describe más adelante.

En la siguiente tabla, se especifican nuestras recomendaciones sobre el uso máximo de la CPU para instancias regionales, birregionales y multirregionales. Estos números garantizan que tu instancia tenga suficiente capacidad de procesamiento para seguir entregando tu tráfico en caso de que se pierda una zona completa (para instancias regionales) o una región completa (para birregión y multirregión de Compute Engine).

Métrica Máximo para las instancias regionales Máximo por región para instancias birregionales y multirregionales
Total de prioridad alta 65% 45%
Agregación suavizada de 24 horas 90% 90%

Para ayudarte a mantenerte por debajo de los valores máximos recomendados, crea alertas en Cloud Monitoring que realicen un seguimiento del uso de CPU de prioridad alta y del uso de CPU promedio durante las 24 horas.

El uso de CPU puede tener un impacto en las latencias de solicitud. La sobrecarga de un servidor de backend individual activará latencias de solicitud mayores. Aplicaciones debe ejecutar comparativas y supervisión activa para verificar que Spanner cumple con sus requisitos de rendimiento.

Por lo tanto, para aplicaciones cuyo rendimiento puede verse afectado, es posible que debas reducir aún más el uso de CPU mediante las técnicas que se describen en la sección siguiente.

Uso de CPU superior al 100%

En algunos casos, el uso de CPU de una instancia de Spanner puede alcanzar por encima del 100%. Esto significa que la instancia usa más recursos de CPU la cantidad configurada para la instancia.

Los recursos de CPU superiores al 100% podrían usarse para brindar funciones durante los aumentos repentinos del uso de CPU, por ejemplo, causados por de aumento en el tráfico de solicitudes.

La capacidad de la CPU por encima del 100% NO está garantizada y no se debe confiar en ella las operaciones normales de la base de datos.

Ejecutar una instancia de Spanner con un uso de CPU cercano o superior al 100% para un período prolongado tiene el riesgo de degradar el rendimiento normal de la operación y latencia. Los recursos de CPU adicionales no son un mecanismo seguro en el cual confiar para rendimiento coherente.

A los clientes no se les factura este uso de CPU adicional.

Reduce el uso de CPU

En esta sección, se explica cómo reducir el uso de CPU de una instancia.

En general, recomendamos que aumentes la capacidad de procesamiento de la instancia como punto de partida. Después de aumentar la capacidad de procesamiento, puedes investigar y abordar las causas principales del uso de CPU elevado.

Aumento de la capacidad de procesamiento

Si excedes los valores máximos recomendados para el uso de CPU, la recomendación de aumentar la capacidad de procesamiento de tu instancia puede seguir funcionando de manera eficaz. Si deseas automatizar este proceso, puedes crear una aplicación que supervise el uso de CPU y que aumente o disminuya la capacidad de procesamiento según sea necesario mediante el método UpdateInstance.

Para determinar cuánta capacidad de procesamiento necesitas, considera el pico de uso de CPU de prioridad alta, así como el promedio suavizado de las 24 horas. Asigna siempre capacidad de procesamiento suficiente para mantener el uso de CPU por debajo de los valores máximos recomendados. Como ya se describió, es posible que debas asignar capacidad de cómputo adicional para las aplicaciones cuyo rendimiento pueda verse afectado (por ejemplo, con el fin de que se adapten a los picos de cargas de trabajo).

Si no tienes suficiente capacidad de procesamiento, Spanner pospone tareas nivel de prioridad. Las tareas del sistema de prioridad baja, como la compactación de bases de datos y la validación de cambios de esquemas, pueden postergarse a favor de las tareas del usuario. Sin embargo, estas tareas son fundamentales para el estado de la instancia, y Spanner no puede diferir de forma indefinida. Si Spanner no puede completar su sistema de prioridad baja tareas dentro de un período determinado, entre varias horas y un día, debido a recursos de procesamiento insuficientes, Spanner podría aumentar la prioridad las tareas del sistema. Este cambio afecta el rendimiento de las tareas del usuario.

Investigación más detallada con herramientas de introspección

Si la métrica Uso de CPU por tipo de operación indica que se debe tipo de operación contribuye a un alto uso de CPU, usa el herramientas de introspección para solucionar más problemas. Para obtener más información, consulta Investigación del uso alto de CPU.

¿Qué sigue?