Puedes usar ComputeClasses para ejecutar cargas de trabajo de Autopilot de Google Kubernetes Engine (GKE) en tus clústeres del modo estándar de GKE. En esta página se describen los métodos que puedes usar para ejecutar tus cargas de trabajo en el modo Autopilot y se te ayuda a decidir cuándo ejecutar una carga de trabajo en un modo específico.
Esta información está dirigida a las siguientes personas:
- Arquitectos de la nube que quieran optimizar los costes operativos de las organizaciones.
- Administradores de plataformas que quieran reducir la sobrecarga de la gestión manual de la infraestructura.
- Ingenieros de fiabilidad de sitios web (SREs) que quieran delegar el mantenimiento, las actualizaciones y el escalado de la infraestructura en Google Cloud cuando sea posible.
Ya deberías conocer los siguientes conceptos:
Acerca de Autopilot de GKE
Autopilot es un modo de funcionamiento de GKE en el que Google gestiona tu infraestructura de nodos, escalado, seguridad y funciones preconfiguradas. El modo Autopiloto está optimizado para ejecutar la mayoría de las cargas de trabajo de producción en un entorno que aplica la configuración recomendada para la seguridad, la fiabilidad, el rendimiento y la escalabilidad. Para decidir entre el modo Autopilot y el modo Estándar en función de tus requisitos, consulta Acerca de los modos de funcionamiento de GKE.
Puedes usar el modo Autopiloto de las siguientes formas:
- Crea un clúster que use el modo Autopilot: Google gestiona todo el clúster y aplica las prácticas recomendadas para la automatización, la fiabilidad, la seguridad y los costes.
- Ejecutar cargas de trabajo en el modo Autopilot en clústeres estándar: despliega ComputeClasses de Autopilot y las selecciona en las cargas de trabajo. Google gestiona los nodos que GKE crea para esas cargas de trabajo específicas. Tú controlas el clúster y puedes ejecutar tus propios grupos de nodos junto con los nodos que gestiona GKE.
Acerca del modo Autopilot de ComputeClasses
Una ComputeClass es un recurso personalizado de Kubernetes que define una lista de configuraciones de nodos, como tipos de máquinas o ajustes de funciones. Puedes seleccionar ComputeClasses específicos en las especificaciones de cargas de trabajo de Kubernetes. Cuando una carga de trabajo que selecciona una ComputeClass necesita un nodo nuevo, GKE intenta aprovisionar el nodo con una de las configuraciones que declara la ComputeClass. GKE prueba cada configuración de ComputeClass en orden y vuelve a la siguiente configuración si falla la creación del nodo. Para obtener más información, consulta el artículo Acerca de las ComputeClasses personalizadas.
Para ejecutar cargas de trabajo de Autopilot en tus clústeres estándar de GKE, habilita el modo Autopilot en una ComputeClass y selecciona esa ComputeClass en cargas de trabajo específicas. Google gestiona los nodos nuevos que GKE aprovisiona para estas cargas de trabajo, de forma similar a como gestiona los nodos de los clústeres Autopilot. La mayoría de las ventajas y las funciones de seguridad del modo Autopilot se aplican a esas cargas de trabajo y a los nodos host.
Las ComputeClasses del modo Autopilot ofrecen a los administradores de clústeres más flexibilidad para elegir el nivel de control que quieren tener sobre cargas de trabajo e infraestructuras específicas de su clúster. Por ejemplo, pueden hacer lo siguiente:
- Puedes dejar que GKE gestione completamente cargas de trabajo específicas ejecutándolas en el modo Autopilot.
- Tienes control total sobre las cargas de trabajo y la infraestructura que no usan el modo Autopilot, como los grupos de nodos creados manualmente.
- Puedes definir una ComputeClass de Autopilot como predeterminada para tu clúster o espacio de nombres, de forma que las cargas de trabajo se ejecuten en el modo Autopilot a menos que soliciten explícitamente otra opción.
Estas opciones permiten a los administradores de clústeres decidir el nivel y el ámbito con los que usan Autopilot.
Las ComputeClasses del modo Autopilot ofrecen a los administradores de clústeres más flexibilidad para elegir el nivel de control que quieren tener sobre cargas de trabajo e infraestructuras específicas de su clúster. Por ejemplo, pueden hacer lo siguiente:
- Puedes dejar que GKE gestione completamente cargas de trabajo específicas ejecutándolas en el modo Autopilot.
- Tienes control total sobre las cargas de trabajo y la infraestructura que no usan el modo Autopilot, como los grupos de nodos creados manualmente.
- Puedes definir una ComputeClass de Autopilot como predeterminada para tu clúster o espacio de nombres, de forma que las cargas de trabajo se ejecuten en el modo Autopilot a menos que soliciten explícitamente otra opción.
Estas opciones permiten a los administradores de clústeres decidir el nivel y el ámbito con los que usan Autopilot.
Ventajas de usar ComputeClasses de Autopilot en clústeres Standard
Ejecutar algunas de tus cargas de trabajo en el modo Autopilot te ofrece ventajas como las siguientes:
- Reduce los costes de gestión de la infraestructura: Google actualiza, mantiene, configura y optimiza nodos específicos por ti.
- Usar el modelo de precios de Autopilot: las cargas de trabajo que usan una ComputeClass de Autopilot se facturan según el modelo de precios de Autopilot. Este modelo de precios incluye la facturación por pod para las cargas de trabajo que no solicitan hardware específico. Para obtener más información, consulta la sección de precios.
- Mejorar el escalado y la seguridad: las cargas de trabajo de Autopilot obtienen ventajas como el acceso a la plataforma de computación optimizada para contenedores, las restricciones de seguridad predeterminadas mejoradas y el autoescalado de nodos basado en solicitudes de recursos. Los nodos de esas cargas de trabajo usan funciones como las actualizaciones automáticas de nodos y las reparaciones automáticas.
- Mejorar la fiabilidad: el acuerdo de nivel de servicio de GKE incluye un objetivo de nivel de servicio de tiempo de actividad de los pods para Autopilot.
Muchas de estas ventajas también las ofrecen los clústeres Autopilot, que también proporcionan una experiencia más gestionada que los clústeres estándar e incluyen varias ventajas de seguridad, redes y gestión de recursos. Para obtener más información, consulta la información general sobre Autopilot.
Selección de hardware en ComputeClasses de Autopilot
En Autopilot ComputeClasses, puedes seleccionar hardware específico para tus nodos (como GPUs o tipos de máquinas) o dejar que GKE coloque pods en una plataforma de computación de uso general optimizada para contenedores. La opción de uso general se recomienda para la mayoría de las cargas de trabajo de producción que no requieren hardware específico para funcionar correctamente.
En la siguiente tabla se describen estas opciones de configuración, cómo elegir una en ComputeClass y cómo afecta esta elección a tu modelo de facturación:
Requisitos de la carga de trabajo | Configuración recomendada de ComputeClass | Modelo de facturación |
---|---|---|
Cargas de trabajo de uso general | Usa una ComputeClass de Autopilot que tenga la regla de prioridad
Las ComputeClasses de Autopilot integradas que están disponibles para los clústeres estándar usan la regla de prioridad |
Modelo de facturación basado en pods |
Cargas de trabajo que necesitan hardware específico | Usa una ComputeClass que utilice cualquier regla de configuración de hardware disponible, como la regla |
Modelo de facturación basado en nodos |
Configuración de Autopilot en ComputeClasses
Puedes usar el modo Autopilot en un clúster estándar mediante una ComputeClass de Autopilot integrada que proporciona GKE o habilitando Autopilot en cualquier ComputeClass personalizada que crees. En las siguientes secciones se describe cada opción.
Clases de cálculo de Autopilot integradas
GKE configura clases de Compute específicas de Autopilot por ti. Puedes seleccionar estas clases de Autopilot integradas en cualquier clúster apto. Las ComputeClasses de Autopilot integradas en los clústeres Standard usan la regla de prioridad podFamily
para ejecutar pods en la plataforma de computación optimizada para contenedores. Para obtener más información, consulta Acerca de las ComputeClasses integradas en GKE.
Clases de Compute personalizadas de Autopilot
Puedes habilitar Autopilot en cualquier ComputeClass personalizado que gestiones.
Esta opción es útil si tus cargas de trabajo tienen requisitos de hardware específicos.
El campo autopilot
del recurso personalizado ComputeClass
te permite habilitar o inhabilitar Autopilot en una ComputeClass específica.
Para habilitar Autopilot en una ComputeClass, debes eliminarla, actualizar la configuración y volver a crearla en tu clúster. Los cambios se aplican a los nodos nuevos que GKE crea para las cargas de trabajo que implementes después de actualizar la ComputeClass de Autopilot.
Para obtener más información sobre cómo habilitar Autopilot en tus clases de computación personalizadas, consulta Seleccionar hardware específico para tus pods de Autopilot.
Precios
Los precios de Autopilot de GKE se aplican a los nodos y las cargas de trabajo que GKE crea para una ComputeClass de Autopilot. En la siguiente tabla se describe el modelo de facturación que se aplica a las diferentes configuraciones de Autopilot ComputeClass en los clústeres del modo Estándar.
Modelos de facturación para diferentes configuraciones de ComputeClass | |
---|---|
Modelo de facturación basado en pods | El modelo de facturación basado en pods se aplica a las clases de computación de Autopilot que usan la regla de prioridad podFamily en lugar de seleccionar máquinas o hardware específicos. Las clases de computación de Autopilot integradas, que usan la regla podFamily , utilizan el modelo de facturación basado en pods. |
Modelo de facturación basado en nodos | El modelo de facturación basado en nodos se aplica a las clases de computación de Autopilot que solicitan explícitamente configuraciones de nodos específicas, como instancias N2 o GPUs. |
Los precios de Autopilot solo se aplican a las cargas de trabajo y los nodos que usan una ComputeClass Autopilot. Tu clúster en modo estándar y cualquier otro grupo de nodos que ejecutes seguirán usando los precios del modo estándar de GKE.
Configuración predefinida de los nodos gestionados por Autopilot
Antes de habilitar el modo Autopilot en tus ComputeClasses, debes saber qué esperar de los nodos que crea GKE para ejecutar las cargas de trabajo de Autopilot. Google configura funciones y restricciones de seguridad específicas en los nodos Autopilot. Por lo tanto, es posible que el modo Autopilot rechace las cargas de trabajo que se despliegan y funcionan correctamente en los nodos del modo Estándar si no cumplen los requisitos de seguridad de Autopilot.
En la siguiente tabla se describen las configuraciones de funciones que anulan los ajustes correspondientes de tu clúster estándar. Si una configuración no está en esta tabla, los nodos de Autopilot usarán el ajuste de clúster Estándar. Por ejemplo, Workload Identity Federation para GKE no está en esta tabla, lo que significa que el ajuste de Workload Identity Federation para GKE del clúster estándar se aplica a los nodos de Autopilot que crea GKE.
Función | Configuración estándar a nivel de clúster | Ajuste de nodos gestionados por Autopilot |
---|---|---|
Actualizaciones y mantenimiento de nodos |
Configurable: |
Preconfigurado:
|
Autoescalado | Configurable: Perfil de autoescalado | Preconfigurado: perfil de autoescalado optimize-utilization |
Redes | Nativa de VPC o basada en rutas | Requiere un clúster nativo de VPC |
Seguridad |
Configurable:
|
Preconfigurado:
|
Sistema operativo del nodo |
Configurable: |
Preconfigurado:
|
Disco de arranque del nodo |
Configurable: |
Configurable:
|
Metadatos de los nodos |
|
|
Solicitudes de recursos para cargas de trabajo de Autopilot
Para que las cargas de trabajo de Autopilot se ejecuten de forma eficiente, GKE aplica determinados valores mínimos y máximos a las solicitudes de CPU, memoria y almacenamiento efímero de tus pods. GKE también aplica solicitudes predeterminadas a los pods que no solicitan explícitamente uno de estos recursos. Los valores específicos de los requisitos de recursos mínimos, máximos y predeterminados de las cargas de trabajo de Autopilot de GKE varían en función del tipo de hardware que utilicen tus pods.
En el caso del almacenamiento efímero, el valor predeterminado si no solicitas almacenamiento efímero es el mismo para todas las selecciones de ComputeClass y hardware. Para obtener más información, consulta Solicitudes de recursos predeterminadas.
En la siguiente tabla se incluyen enlaces a los requisitos de CPU y memoria de tus solicitudes de pods, en función del tipo de hardware:
Tipo de recurso | Solicitudes mínimas y máximas | Solicitudes predeterminadas |
---|---|---|
Pods de uso generalpodFamily regla de prioridad |
Consulta la fila "General-purpose" de la tabla Mínimos y máximos de ComputeClasses. | Consulta la fila "General-purpose" de la tabla Solicitudes predeterminadas de ComputeClasses. |
GPUs y TPUs | Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Mínimos y máximos de Accelerator ComputeClass. | Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Solicitudes predeterminadas de aceleradores. |
Tipos y familias de máquinas de Compute Engine específicos |
|
Para cualquier tipo o familia de máquinas de Compute Engine, las solicitudes predeterminadas se indican en la fila "General-purpose" (General) de la tabla Solicitudes predeterminadas de ComputeClasses. |
Siguientes pasos
- Desplegar cargas de trabajo en modo Autopilot en clústeres estándar
- Acerca de las clases Compute personalizadas