Escalador automático administrado

En esta página, se describe cómo funciona el escalador automático administrado, se describen los costos y las limitaciones de seguridad cuando se usa el escalador automático administrado. También proporciona información a te ayudará a determinar cómo configurar el escalador automático administrado.

Cómo funciona el escalador automático administrado

Cuando habilitas el escalador automático administrado, Spanner ajusta automáticamente la el tamaño de la instancia. La función de escalador automático administrado reacciona a los cambios según las necesidades de almacenamiento o la carga de trabajo de tu instancia. El ajuste de escala automático administrado escala verticalmente y agrega capacidad de procesamiento a la instancia. o reduce la escala verticalmente, lo que quita la capacidad de procesamiento de la instancia.

Al configurar el escalador automático administrado, puede usar las unidades de procesamiento instancias pequeñas, o nodos para instancias grandes. En este documento, usamos el término capacidad de procesamiento para referirse a nodos o unidades de procesamiento.

El escalador automático administrado de Spanner determina la cantidad de procesamiento la capacidad de almacenamiento es obligatoria en función de los siguientes factores:

  • Objetivo de uso de CPU de alta prioridad
  • Objetivo de uso de almacenamiento
  • Límite mínimo
  • Límite máximo

Cada dimensión de escalamiento genera un tamaño de instancia recomendado. Spanner usa automáticamente el más alto. Esto significa que, para Por ejemplo, si tu instancia necesita 10 nodos para cumplir con solo 12 nodos para cumplir con el objetivo de uso de CPU, Spanner escala la instancia a 12 nodos.

A medida que cambia la capacidad de procesamiento, Spanner continuamente optimiza el almacenamiento. Rebalancea los datos en todos los servidores. para garantizar que el tráfico se distribuya de manera uniforme y ningún servidor individual esté sobrecargado. Consulta Limitaciones para obtener más información.

Si el escalador automático administrado escala una instancia hasta su límite máximo, pero carga de trabajo sigue causando un uso de CPU mayor que el destino, las solicitudes de carga de trabajo podrían tener una mayor la latencia o fallan. Si una instancia escala verticalmente hasta su objetivo de capacidad de procesamiento máxima pero la carga de trabajo necesita más almacenamiento que el límite, escribe pueden fallar. Para saber si se alcanzó el objetivo máximo, puedes ver los registros de eventos del sistema del escalador automático administrado en la consola de Google Cloud en la Página Estadísticas del sistema Para obtener más información, consulta límites de almacenamiento.

Cuando Spanner reduce la escala de una instancia, quita la capacidad de procesamiento a un ritmo más lento que cuando se aumenta la escala para reducir el impacto en la latencia.

Costos

Los costos totales de Spanner pueden ser menores o mayores según cómo configuraste tu instancia de Spanner antes de habilitar del escalador automático administrado y los límites que estableces para él.

Por ejemplo, si antes configurabas manualmente tu servidor para manejar las cargas de trabajo máximas en cualquier momento, sus costos con el escalador automático administrado pueden ser menores porque reduce de procesamiento cuando la instancia está inactiva.

Si solías configurar manualmente tu instancia de Spanner para que tuviera capacidad de procesamiento suficiente para las cargas de trabajo promedio y degrada el rendimiento general Cuando aumenta el tráfico de la carga de trabajo, los costos del escalador automático administrado puede ser mayor porque el escalador automático administrado podría aumentar la capacidad de procesamiento cuando la instancia está ocupada. Sin embargo, esto brinda a tus usuarios más rendimiento coherente.

Puedes limitar el costo máximo de tu instancia de Spanner estableciendo el límite máximo de nodos o unidades de procesamiento en el nivel que desees y optimizar tus inversiones en redes.

Limitaciones

Se aplican las siguientes limitaciones cuando habilitas o cambias el ajuste de escala automático en una instancia:

  • No puedes mover una instancia cuando la función de escalador automático administrado está habilitada. Primero debes inhabilitar el administrador escalador automático y mover la instancia. Después de trasladar la instancia, puedes volver a habilitar el escalador automático administrado.
  • Debes establecer el límite mínimo de la instancia con ajuste de escala automático en 1,000. unidades de procesamiento, o más, 1 nodo o más.
  • Cuando habilitas el ajuste de escala automático en una instancia existente, esta la capacidad puede ser menor que el valor límite mínimo que Configurar en el escalador automático administrado. Sin embargo, la instancia escala automáticamente hasta el mínimo configurado valor cuando lo inicias. Por ejemplo, si tu instancia tiene un nodo, pero establece el valor mínimo en dos nodos, cuando inicias tu instancia, escala automáticamente hasta 2 nodos.

Parámetros administrados del escalador automático

Cuando creas o editas una instancia y eliges habilitar el escalador automático debes definir los valores que se muestran en la siguiente tabla.

Parámetro Descripción
Objetivo de uso de CPU de alta prioridad Un porcentaje de la capacidad de CPU de alta prioridad de la instancia. Este valor debe ser del 10% al 90%. Cuando el uso de CPU de una instancia supera objetivo que configuraste, Spanner agrega inmediatamente recursos capacidad a la instancia. Cuando el uso de CPU es sustancialmente menor que de destino, Spanner quita la capacidad de procesamiento. Para obtener orientación, ver Determina el objetivo de uso de CPU.
Objetivo de uso de almacenamiento El porcentaje de almacenamiento en un nodo que puedes usar antes Spanner escala verticalmente. Este objetivo garantiza que siempre capacidad de procesamiento suficiente para manejar las fluctuaciones en la cantidad de datos que almacenas. Este valor debe estar entre el 10% y el 99%. Para obtener orientación, consulta Determina el objetivo de uso de almacenamiento.
Límite mínimo La menor cantidad de capacidad de procesamiento que Spanner reduce la escala de la instancia. El valor mínimo no puede ser inferior al 10% del valor que estableciste para el límite máximo. Por ejemplo: si el límite máximo es de 40 nodos, el límite mínimo debe ser de al menos 4 nodos. El requisito del 10% es un límite estricto. Para guía, consulta Determina el límite mínimo.
Límite máximo La mayor cantidad de capacidad de procesamiento que Spanner escala la instancia. Para los nodos, este valor debe ser mayor que 1 nodo (o 1,000 unidades de procesamiento) y debe ser igual o superior a la cantidad mínima de nodos o unidades de procesamiento. El valor no puede ser más de 10 veces el que elijas para la cantidad mínima de capacidad de procesamiento. Estos 10 de tiempo es un límite estricto. Para obtener orientación, consulta Determina el límite máximo.

Configura el escalador automático administrado

En esta sección, se describe cómo determinar qué números elegir para sus cuentas parámetros del escalador automático. Después de establecer los valores iniciales, supervisar tu instancia y ajustar los números si es necesario.

Determina el objetivo de uso de CPU

El destino óptimo para tu instancia depende de la latencia y la capacidad de procesamiento los requisitos de tu carga de trabajo. Para ver nuestras recomendaciones sobre el uso máximo de CPU, haz lo siguiente: para configuraciones de instancias regionales, birregionales y multirregionales, consulta Alertas de uso de CPU elevado.

En general, si observas una latencia inaceptablemente alta, debes reducir el objetivo de uso de CPU.

Determina el objetivo de uso del almacenamiento

Para el ajuste de escala automático, el objetivo de uso de almacenamiento se expresa como un porcentaje el nodo de inicio de sesión. Para instancias de 1 nodo (1,000 unidades de procesamiento) o más, el almacenamiento se limita a 4 TB por nodo.

Determinar el límite máximo

El valor que elijas como la cantidad máxima de capacidad de procesamiento es igual a la capacidad de procesamiento que necesita la instancia para controlar mucho tráfico, aun si no esperas alcanzar ese volumen en la mayor parte tiempo. Spanner nunca escala verticalmente a una capacidad de procesamiento mayor que la que necesidades empresariales. También puedes considerar este número como la mayor cantidad de procesamiento la capacidad por la que estás dispuesto a pagar. Consulta Parámetros del escalador automático para obtener detalles sobre los valores aceptados.

El límite máximo debe permitir el objetivo de uso de CPU y la el objetivo de uso de almacenamiento que estableces para el ajuste de escala automático.

  • Si cambias una instancia de asignación manual a administrada ajuste de escala automático, encuentra la mayor capacidad de procesamiento que la instancia en los últimos uno o dos meses. El máximo administrado del escalador automático el límite debe ser al menos tan alto.

  • Si quieres habilitar el escalador automático administrado para una instancia nueva de otras instancias y úsalas como guía cuando establezcas los límite máximo.

  • Si tienes una carga de trabajo nueva y no sabes cómo va a crecer, puede estimar la capacidad de procesamiento que necesitas para cumplir con de uso de almacenamiento integrado y, luego, ajustar la cantidad.

También debes saber cuánta cuota queda en tu nodo porque el escalador automático administrado no puede configurar tu instancia para que tenga más capacidad de procesamiento que la cuota. Para obtener más información, consulta Límites de nodos.

Después de que tu instancia esté en funcionamiento con el ajuste de escala automático habilitado, supervisar la instancia y asegurarte de que el valor que elegiste para el límite máximo es al menos tan alto como el límite recomendado para el objetivo de CPU y el límite recomendado para el objetivo de almacenamiento.

Determina el límite mínimo

Establece un límite mínimo para el escalador automático administrado La instancia de Spanner puede reducir la escala verticalmente a la menor tamaño rentable. Spanner evita automáticamente que el nodo recuento de impresiones caiga por debajo del mínimo necesario para mantener la CPU y el almacenamiento objetivos de uso.

El valor mínimo más bajo que permite el escalador automático administrado es 1 nodo o 1,000 unidades de procesamiento. Cuando habilitas el ajuste de escala automático para una instancia menor capacidad que el valor mínimo configurado para el escalador automático administrado, escala automáticamente hasta este mínimo cuando la inicias.

Luego de iniciar la instancia que administra el ajuste de escala automático, debes realizar para garantizar que funcione con el tamaño mínimo establecido. Deberías probar de forma periódica para garantizar que siga funcionando como se espera.

Para obtener más información sobre los valores aceptados, consulta Parámetros administrados del escalador automático en este documento.

En muchos casos, es recomendable establecer el valor mínimo en más de uno. Elige un aumentar el número o el límite mínimo en las siguientes situaciones:

  • Tiene un evento de escala máxima cuando espera que su tráfico aumentar temporalmente, y debes asegurarte de tener suficientes la capacidad de procesamiento.
  • Tu aplicación envía tráfico con aumentos bruscos. Cuando agregas una nueva capacidad de procesamiento, Spanner se rebalancea automáticamente para usar los nuevos nodos o unidades de procesamiento. Debido a que este proceso puede tardar varios minutos, es posible deberías considerar adoptar un enfoque conservador y elegir una mejor mínimo. De esa manera, tu instancia se adapta sin problemas a los aumentos repentinos.
  • Aumentas la capacidad máxima de procesamiento. El mínimo debe ser siempre diez o menos del objetivo de capacidad de procesamiento máxima. Por ejemplo, si establece la cantidad máxima de nodos en 30, debe establecer la cantidad mínima de nodos a al menos 3.

Si aumentas el valor de la capacidad mínima de procesamiento en una instancia Spanner intenta de inmediato escalar la instancia al nuevo mínimo. Las restricciones estándar aplicar. Cuando te quedes sin cuota, tu solicitud para cambiar el escalador automático administrado la configuración falla y no se actualiza.

Marcas y limitaciones de parámetros de Google Cloud CLI

Cuando usas Google Cloud CLI para configurar el escalador automático administrado, hay algunas las marcas obligatorias que debes establecer. Hay marcas opcionales que puedes usar para indicar si quieres usar nodos o unidades de procesamiento. Para obtener más información crear una instancia nueva con el escalador automático administrado o habilitar ajuste de escala automático en una instancia existente, consulta lo siguiente:

Las siguientes marcas son obligatorias cuando habilitas el escalador automático administrado en tu instancia:

  • autoscaling-high-priority-cpu-percent
  • autoscaling-storage-percent

Si decides usar nodos, también debes usar las dos marcas siguientes cuando habilitas el escalador automático administrado:

  • autoscaling-min-nodes
  • autoscaling-max-nodes

Si decides usar unidades de procesamiento, también debes usar las siguientes opciones: marcas cuando habilitas el escalador automático administrado:

  • autoscaling-min-processing-units
  • autoscaling-max-processing-units

Se aplican las siguientes limitaciones cuando se agrega el escalador automático administrado a un instancia existente con Google Cloud CLI:

  • No puedes usar la marca --nodes con --autoscaling-min-nodes o --autoscaling-max-nodes porque, cuando usas --nodes, se establece un cantidad de nodos en lugar de un rango de escalamiento. Del mismo modo, no puedes usar el la marca --processing-units con el autoscaling-min-processing-units o autoscaling-max-processing-units porque se usa --processing-units establece una cantidad específica de unidades de procesamiento en lugar que un rango de escalamiento.
  • No puedes mezclar las marcas de los nodos y las unidades de procesamiento. Para Por ejemplo, no puedes usar --autoscaling-max-nodes con autoscaling-min-processing-units

Ajusta tu configuración

Vigila el uso de tu capacidad de procesamiento y ajusta la configuración, en caso de que cuando sea necesario, en especial tras habilitar el escalador automático administrado por primera vez. Recomendaciones desde la página Estadísticas del sistema Consola de Google Cloud

Control de acceso

Para configurar el escalador automático administrado, debes ser una principal con un rol que crear y actualizar permisos para la instancia que estás configurando.

Supervisión

Spanner proporciona varias métricas para ayudarte a comprender el escalador automático administrado funciona a medida que aumenta o reduce la escala verticalmente para cumplir los requisitos de las cargas de trabajo. Las métricas también pueden ayudarte a determinar si tu configuración son óptimos para cumplir con los requisitos de carga de trabajo y costos de tu empresa. Por ejemplo: si observas que el recuento de nodos de una instancia suele estar cerca del máximo cantidad de nodos, considera aumentar el máximo. Para obtener más información supervisar tus recursos de Spanner, consulta Supervisa instancias con Cloud Monitoring.

Las siguientes métricas son se muestran en los gráficos de la página Estadísticas del sistema en la consola de Google Cloud. También puedes ver estas métricas Cloud Monitoring.

  • spanner.googleapis.com/instance/autoscaling/min_node_count
  • spanner.googleapis.com/instance/autoscaling/max_node_count
  • spanner.googleapis.com/instance/autoscaling/min_processing_units
  • spanner.googleapis.com/instance/autoscaling/max_processing_units
  • spanner.googleapis.com/instance/autoscaling/high_priority_cpu_target_utilization
  • spanner.googleapis.com/instance/autoscaling/storage_target_utilization

Logging

Spanner crea un registro de auditoría de eventos del sistema cada vez que escala un instancia.

Puedes ver los registros de eventos del sistema escalador automático administrado en la La consola de Google Cloud en la página Estadísticas del sistema

También puedes ver los registros con el Explorador de registros:

  1. En la consola de Google Cloud, abre el Explorador de registros:

    Ir al Explorador de registros.

  2. Selecciona el proyecto de Google Cloud adecuado.

  3. En el campo Consulta, ingresa lo siguiente:

     protoPayload.methodName="AutoscaleInstance"
    

    Puedes agregar la siguiente consulta para filtrar aún más los registros:

    resource.type="spanner_instance"
    resource.labels.instance_id=INSTANCE_ID
    resource.labels.project_id=PROJECT_ID
    logName="projects/span-cloud-testing/logs/cloudaudit.googleapis.com%2Fsystem_event"
    protoPayload.methodName="AutoscaleInstance"
  4. Haz clic en Ejecutar consulta.

En el panel Resultados de la consulta, se muestran los registros de la última hora.

Para obtener más información sobre cómo ver los registros, consulta Cloud Logging. Puedes configurar alertas basadas en registros. en la página Explorador de registros en Google Cloud o a través del API de Cloud Monitoring.

¿Qué sigue?