Lineamientos operativos para instancias de SQL Server

El ANS de Cloud SQL excluye interrupciones “causadas por factores externos al control razonable de Google”. En esta página, se describen algunas de las configuraciones controladas por el usuario que pueden hacer que se excluya la interrupción de una instancia de Cloud SQL.

Introducción

Cloud SQL se esfuerza por darte tanto control sobre la configuración de tu instancia como sea posible. Esto incluye algunas configuraciones que aumentan el riesgo de tiempo de inactividad de las instancias, según la carga y otros parámetros de configuración. Si tu instancia falla y Cloud SQL determina que fue por incumplimiento de los límites operativos que se describen en esta página, el período de inactividad no estará cubierto por (o no irá en detrimento de) el ANS de Cloud SQL.

Esta lista de límites operativos tiene el objetivo de informarte qué opciones de configuración presentan estos riesgos, cómo evitar usarlas sin darte cuenta y cómo mitigar los riesgos cuando se requieren para el entorno de tu empresa.

Configuraciones excluidas

Las configuraciones excluidas se dividen en las siguientes categorías:

  • Requisitos generales de configuración
  • Valores de marcadores de base de datos
  • Restricciones de recursos

Requisitos generales de configuración

El ANS solo cubre las instancias de Cloud SQL configuradas para alta disponibilidad con al menos una CPU dedicada. No cubre las instancias de núcleo compartido y de zona única.

Si la instancia está configurada y se usa de tal manera que la carga de trabajo sobrecarga la instancia, el ANS no se aplica. Estos son algunos ejemplos de estos casos:

  • Una combinación de work_mem, consultas de carga de trabajo específicas y cantidad de conexiones activas paralelas hace que el sistema se quede sin memoria, lo que provoca que los backends de trabajador de PostgreSQL fallen con las operaciones de recuperación resultantes ejecutadas por PostgreSQL.
  • Una combinación de checkpoint_timeout, max_wal_size y una carga de trabajo alta, posiblemente junto con un tamaño de VM poco potenciado, da como resultado una situación en la que la recuperación (reproducción de WA) lleva mucho tiempo.
  • Las transacciones muy largas que se ejecutan junto con las cargas de trabajo que crean una gran cantidad de archivos temporales dificultan el mantenimiento de autovacuum, lo que puede aumentar la tabla y el rendimiento.

Estos ejemplos no son una lista completa, ya que existen muchas formas de sobrecargar la base de datos de PostgreSQL. Te recomendamos configurar alertas y supervisión en Cloud Monitoring.

Valores de marcas de base de datos

Cloud SQL te permite configurar la instancia con marcas de base de datos. Algunos de estos marcadores se pueden configurar en formas que pueden comprometer la estabilidad de la instancia o la durabilidad de sus datos.

Restricciones de recursos

Se deben evitar estas restricciones de recursos para mantener la cobertura del ANS:

Restricción Descripción Detección Solución Prevención
Almacenamiento lleno Si tu instancia se queda sin almacenamiento y la capacidad de aumento automático del almacenamiento está desactivada, tu instancia se quedará sin conexión; esta interrupción no está cubierta por el ANS. Puedes ver la cantidad de almacenamiento que usa tu instancia en la página Detalles de la instancia en Cloud Console. Más información

Configura una alerta de Stackdriver para supervisar el uso de almacenamiento y recibir alertas en un límite especificado. Más información

Aumenta el tamaño de almacenamiento para la instancia. Aunque el tamaño del almacenamiento se puede aumentar, no se puede disminuir. Habilita el aumento automático del almacenamiento para la instancia. Más información
CPU sobrecargada Si el uso de CPU está por encima del 98% durante 6 horas, tu instancia no tiene el tamaño adecuado para tu carga de trabajo y esto no está cubierto por el ANS. Puedes ver el porcentaje de CPU disponible que usa tu instancia en la página Detalles de la instancia en Cloud Console. Más información

Configura una alerta de Stackdriver para supervisar el uso de CPU y recibir alertas en un límite especificado. Más información

Aumenta el número de CPU para tu instancia. Ten en cuenta que cambiar las CPU requiere que se reinicie la instancia.

Si tu instancia ya tiene la cantidad máxima de CPU, fragmenta la base de datos en varias instancias.

Supervisa el uso de CPU y aumenta su número cuando sea necesario. Ten en cuenta que, a fin de cambiar las CPU virtuales de tu instancia, debes reiniciarla.