Ajuste de escala automático vertical de pods

En esta página, se proporciona una descripción general del ajuste de escala automático vertical de pods, y se explica cómo puedes usarlo con el fin de ajustar las solicitudes de CPU y las solicitudes de memoria para los contenedores. En esta página, también se proporciona material de referencia para el recurso personalizado VerticalPodAutoscaler y los tipos relacionados.

Descripción general

El ajuste de escala automático vertical de pods (VPA) te libera de tener que decidir cuáles son los valores que debes especificar para las solicitudes de CPU y memoria de un contenedor. El escalador automático te puede recomendar valores de requisitos de CPU y memoria, o puede actualizar de manera automática los valores de requisitos de CPU y memoria.

El ajuste de escala automático vertical de pod proporciona los siguientes beneficios:

  • Los nodos de clúster se usan de manera eficiente, porque los pods usan exactamente los recursos que necesitan.

  • Los pods se programan en nodos que tienen los recursos adecuados disponibles.

  • No es necesario que ejecutes tareas comparativas que requieren mucho tiempo para determinar los valores correctos de requisitos de CPU y memoria.

  • Se reduce el tiempo de mantenimiento, ya que el escalador automático puede ajustar los requisitos de CPU y memoria en el tiempo sin que tengas que realizar ninguna acción.

Limitaciones para Beta

  • El ajuste de escala automático vertical de pod admite un máximo de 200 objetos VPA por clúster.

  • El ajuste de escala automático vertical de pods es compatible con los clústeres regionales a partir de la versión 1.12.6.

  • No uses el ajuste de escala automático vertical de pod con Ajuste de escala automático horizontal de pod (HPA) en CPU o memoria. Sin embargo, puedes usar el VPA con el HPA en métricas personalizadas y externas.

  • El escalador automático vertical de pods aún no está listo para su uso con cargas de trabajo de Java debido a la visibilidad limitada del uso real de la memoria por parte de la carga de trabajo.

Ajuste de escala automático vertical de pod en modo automático

Debido a las limitaciones de Kubernetes, la única manera de modificar los requisitos de recursos de un pod en ejecución es volver a crear el pod. Por lo tanto, cuando creas un recurso VerticalPodAutoscaler con un updateMode de "Auto", el VerticalPodAutoscaler desalojará un pod si necesita cambiar las solicitudes de recursos de este último.

Para limitar la cantidad de reinicios del pod, usa un presupuesto de interrupción de pod.

Para asegurarte de que tu clúster pueda controlar los tamaños nuevos de tus cargas de trabajo, usa el escalador automático de clústeres y el aprovisionamiento automático de nodos. El escalador automático vertical de pods notifica al escalador automático de clústeres antes de la actualización, y se proporcionan los recursos necesarios para el nuevo tamaño de carga de trabajo antes de volver a crearla a fin de minimizar el tiempo de interrupción.

Qué sigue

Referencia

VerticalPodAutoscaler v1beta2 autoscaling.k8s.io

Campos

TypeMeta

Grupo de API, versión y tipo

metadata

ObjectMeta

Metadatos de objeto estándar

spec

VerticalPodAutoscalerSpec

El comportamiento deseado del VerticalPodAutoscaler

status

VerticalPodAutosclerStatus

El estado más reciente del VerticalPodAutoscaler.

VerticalPodAutoscalerSpec v1beta2 autoscaling.k8s.io

Campos
targetRef

CrossVersionObjectReference

Referencia al controlador que administra el conjunto de pods que el escalador automático debe controlar, por ejemplo, una instancia de Deployment o StatefulSet. Puedes apuntar un recurso VerticalPodAutoscaler hacia cualquier controlador que tenga un subrecurso [Scale](https://kubernetes.io/docs/reference/generated/kubernetes-api/v1.13/#scalespec-v1-autoscaling){:.external}. Por lo general, VerticalPodAutoscaler recupera el conjunto de pods desde el ScaleStatus del controlador. En algunos controladores conocidos, como DaemonSet, VerticalPodAutoscaler recupera el conjunto de pods desde las especificaciones del controlador.

updatePolicy

PodUpdatePolicy

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un pod, y si las actualizaciones recomendadas se aplican durante la vida útil del pod.

resourcePolicy

PodResourcePolicy

Especifica las políticas sobre cómo se ajustan los requisitos de CPU y memoria para los contenedores individuales.

VerticalPodAutoscalerList v1beta2 autoscaling.k8s.io

Campos

TypeMeta

Grupo de API, versión y tipo

metadata

ObjectMeta

Metadatos de objeto estándar

items

VerticalPodAutoscaler array

Una lista de objetos de VerticalPodAutoscaler

PodUpdatePolicy v1beta2 autoscaling.k8s.io

Campos
updateMode

string

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un pod, y si las actualizaciones recomendadas se aplican durante la vida útil del pod. Los valores posibles son “Apagado”, “Inicial”, “Volver a crear” y “Auto”.

PodResourcePolicy v1beta2 autoscaling.k8s.io

Campos
containerPolicies

ContainerResourcePolicy array

Un arreglo de políticas de recursos para contenedores individuales

ContainerResourcePolicy v1beta2 autoscaling.k8s.io

Campos
containerName

string

El nombre del contenedor al cual se aplica la política. Si no se especifica, la política se usa como política predeterminada.

mode

ContainerScalingMode

Especifica si se aplican las actualizaciones recomendadas cuando se inicia un contenedor, y si las actualizaciones recomendadas se aplican durante la vida útil del contenedor. Los valores posibles son “Apagado” y “Auto”.

minAllowed

ResourceList

Especifica los requisitos de CPU y memoria mínimos que se permiten para el contenedor.

maxAllowed

ResourceList

Especifica los requisitos de CPU y memoria máximos que se permiten para el contenedor.

VerticalPodAutoscalerStatus v1beta2 autoscaling.k8s.io

Campos
recommendation

RecommendedPodResources

Los requisitos de CPU y memoria recomendados más recientes

conditions

VerticalPodAutoscalerCondition array

Describe el estado actual del VerticalPodAutoscaler.

RecommendedPodResources v1beta2 autoscaling.k8s.io

Campos
containerRecommendation

RecommendedContainerResources array

Un arreglo de recomendaciones de recursos para contenedores individuales

RecommendedContainerResources v1beta2 autoscaling.k8s.io

Campos
containerName

string

El nombre del contenedor al cual se aplica la recomendación

target

ResourceList

Los requisitos de CPU y memoria recomendados para el contenedor

lowerBound

ResourceList

Los requisitos de CPU y memoria mínimos recomendados para el contenedor. No se garantiza que esta cantidad sea suficiente para que la aplicación permanezca estable. Es probable que la ejecución con menos requisitos de CPU y memoria tenga un impacto considerable en el rendimiento o la disponibilidad.

upperBound

ResourceList

Los requisitos de CPU y memoria máximos recomendados para el contenedor. Es probable que los requisitos de CPU y memoria que superen estos valores se desperdicien.

uncappedTarget

ResourceList

La recomendación de recursos más reciente que procesó el escalador automático, solo en función del uso real de recursos y sin tener en cuenta la ContainerResourcePolicy. Puede variar de la recomendación delimitada si el uso real de recursos hace que el objetivo viole la ContainerResourcePolicy. Este campo solo se usa como indicador de estado; no afecta la asignación real de recursos.

VerticalPodAutoscalerCondition v1beta2 autoscaling.k8s.io

Campos
type

VerticalPodAutoscalerConditionType

El tipo de condición que se describe. Los valores posibles son “RecommendationProvided”, “LowConfidence”, “NoPodsMatched” y “FetchingHistory”.

status

ConditionStatus

El estado de la condición. Los valores posibles son Verdadero, Falso y Desconocido.

lastTransitionTime

Time

La última vez que la condición hizo una transición de un estado a otro

reason

string

La razón por la cual se realizó la última transición de un estado a otro

message

string

Una string legible que proporciona detalles sobre la última transición de un estado a otro

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Documentación de Kubernetes Engine