Ajuste de escala automático vertical de pods

En esta página, se proporciona una descripción general del ajuste de escala automático vertical de pods y se explica cómo puedes usarlo con el fin de ajustar las solicitudes y límites de CPU y las solicitudes y límites de memoria para los contenedores. En esta página, también se proporciona material de referencia para el recurso personalizado VerticalPodAutoscaler y los tipos relacionados.

Descripción general

El ajuste de escala automático vertical de pods (VPA) te libera de tener que decidir cuáles son los valores que debes especificar para las solicitudes de CPU y memoria de un contenedor. El escalador automático te puede recomendar valores de requisitos de CPU y memoria o puede actualizar de manera automática los valores.

El ajuste de escala automático vertical de pod proporciona los siguientes beneficios:

  • Los nodos de clúster se usan de manera eficiente, porque los pods usan exactamente los recursos que necesitan.

  • Los pods se programan en nodos que tienen los recursos adecuados disponibles.

  • No es necesario que ejecutes tareas comparativas que requieren mucho tiempo para determinar los valores correctos de requisitos de CPU y memoria.

  • Se reduce el tiempo de mantenimiento, ya que el escalador automático puede ajustar los requisitos de CPU y memoria en el tiempo sin que tengas que realizar ninguna acción.

Limitaciones del ajuste de escala automático vertical de pods:

  • El ajuste de escala automático vertical de pods admite un máximo de 500 objetos VPA por clúster.

  • El ajuste de escala automático vertical de pods es compatible con los clústeres regionales a partir de la versión 1.12.6.

  • No uses el ajuste de escala automático vertical de pod con Ajuste de escala automático horizontal de pod (HPA) en CPU o memoria. Sin embargo, puedes usar la VPA con el HPA en métricas personalizadas y externas.

  • El ajuste de escala automático vertical de pods aún no está listo para usarse con cargas de trabajo basadas en JVM, debido a la visibilidad limitada del uso real de la memoria de la carga de trabajo.

  • El ajuste de escala automático vertical de pods no puede aplicar las recomendaciones de los archivos adicionales inyectados de forma automática. Si creas un objeto VerticalPodAutoscaler para un pod con archivos adicionales inyectados que tengan un updateMode que no sea "Off", esos archivos adicionales deben inhabilitarse mediante la política de recursos de contenedores. Consulta ContainerResourcePolicy en la sección de referencia y cómo inhabilitar contenedores específicos.

    Uno de los problemas conocidos es el uso del ajuste de escala automático vertical de pods junto con Istio. Esta limitación de VPA afecta a los archivos adicionales de Istio. Si deseas resolver el problema, usa este comando para extender la especificación VerticalPodAutoscaler que definiste, de modo que se inhabilite el archivo adicional de Istio:

    resourcePolicy:
      containerPolicies:
      - containerName: istio-proxy
        mode: "Off"
    

Ajuste de escala automático vertical de pods en modo automático

Debido a las limitaciones de Kubernetes, la única manera de modificar las solicitudes de recursos de un pod en ejecución consiste en volver a crear el pod. Si creas un VerticalPodAutoscaler cuyo updateMode es "Auto", el VerticalPodAutoscaler expulsa un pod si necesita cambiar sus solicitudes de recursos.

Para limitar la cantidad de reinicios del pod, usa un presupuesto de interrupción de pod.

Para asegurarte de que tu clúster pueda controlar los tamaños nuevos de tus cargas de trabajo, usa el escalador automático de clústeres y el aprovisionamiento automático de nodos. El escalador automático vertical de pods notifica al escalador automático de clústeres antes de la actualización, y se proporcionan los recursos necesarios para el nuevo tamaño de carga de trabajo antes de volver a crearla a fin de minimizar el tiempo de interrupción.

Próximos pasos

Referencia

VerticalPodAutoscaler v1 autoscaling.k8s.io

Campos

TypeMeta

Grupo de API, versión y tipo

metadata

ObjectMeta

Metadatos de objeto estándar.

spec

VerticalPodAutoscalerSpec

El comportamiento deseado del VerticalPodAutoscaler.

status

VerticalPodAutoscalerStatus

El estado más reciente del VerticalPodAutoscaler.

VerticalPodAutoscalerSpec v1 autoscaling.k8s.io

Campos
targetRef

CrossVersionObjectReference

Referencia al controlador que administra el conjunto de pods que el escalador automático debe controlar, por ejemplo, un objeto Deployment o StatefulSet. Puedes apuntar un VerticalPodAutoscaler a cualquier controlador que tenga un subrecurso Scale. Por lo general, VerticalPodAutoscaler recupera el conjunto de pods desde el ScaleStatus del controlador. En algunos controladores conocidos, como DaemonSet, VerticalPodAutoscaler recupera el conjunto de pods desde las especificaciones del controlador.

updatePolicy

PodUpdatePolicy

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un pod, y si las actualizaciones recomendadas se aplican durante la vida útil del pod.

resourcePolicy

PodResourcePolicy

Especifica las políticas sobre cómo se ajustan los requisitos de CPU y memoria para los contenedores individuales.

VerticalPodAutoscalerList v1 autoscaling.k8s.io

Campos

TypeMeta

Grupo de API, versión y tipo

metadata

ObjectMeta

Metadatos de objeto estándar.

items

VerticalPodAutoscaler array

Una lista de objetos de VerticalPodAutoscaler

PodUpdatePolicy v1 autoscaling.k8s.io

Campos
updateMode

string

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un pod, y si las actualizaciones recomendadas se aplican durante la vida útil del pod. Los valores posibles son “Apagado”, “Inicial”, “Volver a crear” y “Auto”.

PodResourcePolicy v1 autoscaling.k8s.io

Campos
containerPolicies

ContainerResourcePolicy array

Un arreglo de políticas de recursos para contenedores individuales

ContainerResourcePolicy v1 autoscaling.k8s.io

Campos
containerName

string

El nombre del contenedor al cual se aplica la política. Si no se especifica, la política se usa como política predeterminada.

mode

ContainerScalingMode

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un contenedor, y si las actualizaciones recomendadas se aplican durante la vida útil del contenedor. Los valores posibles son “Apagado” o “Auto”.

minAllowed

ResourceList

Especifica los requisitos de CPU y memoria mínimos que se permiten para el contenedor.

maxAllowed

ResourceList

Especifica los requisitos de CPU y memoria máximos permitidos para el contenedor.

VerticalPodAutoscalerStatus v1 autoscaling.k8s.io

Campos
recommendation

RecommendedPodResources

Los requisitos de CPU y memoria recomendados más recientes.

conditions

VerticalPodAutoscalerCondition array

Describe el estado actual del VerticalPodAutoscaler.

RecommendedPodResources v1 autoscaling.k8s.io

Campos
containerRecommendation

RecommendedContainerResources array

Un arreglo de recomendaciones de recursos para contenedores individuales

RecommendedContainerResources v1 autoscaling.k8s.io

Campos
containerName

string

El nombre del contenedor al cual se aplica la recomendación.

target

ResourceList

Los requisitos de CPU y memoria recomendados para el contenedor.

lowerBound

ResourceList

Los requisitos de CPU y memoria mínimos recomendados para el contenedor. No se garantiza que esta cantidad sea suficiente para que la aplicación permanezca estable. Es probable que la ejecución con menos requisitos de CPU y memoria tenga un impacto considerable en el rendimiento o la disponibilidad.

upperBound

ResourceList

Los requisitos de CPU y memoria máximos recomendados para el contenedor. Es probable que los requisitos de CPU y memoria que superen estos valores se desperdicien.

uncappedTarget

ResourceList

La recomendación de recursos más reciente que procesó el escalador automático, en función del uso real de recursos y sin tener en cuenta la ContainerResourcePolicy. Si el uso real de los recursos hace que el objetivo viole la ContainerResourcePolicy, esto podría ser diferente de la recomendación limitada. Este campo no afecta la asignación real de recursos. Solo se usa como indicador de estado.

VerticalPodAutoscalerCondition v1 autoscaling.k8s.io

Campos
type

VerticalPodAutoscalerConditionType

El tipo de condición que se describe. Los valores posibles son “RecommendationProvided”, “LowConfidence”, “NoPodsMatched” y “FetchingHistory”.

status

ConditionStatus

El estado de la condición. Los posibles valores son Verdadero, Falso y Desconocido.

lastTransitionTime

Time

La última vez que la condición hizo una transición de un estado a otro.

reason

string

La razón por la cual se realizó la última transición de un estado a otro.

message

string

Una string legible que proporciona detalles sobre la última transición de un estado a otro.