Cuotas y límites


En este documento, se describen los límites y las cuotas que se aplican a Google Kubernetes Engine. Para obtener más información sobre las cuotas, consulta Cuotas de la nube privada virtual.

Una cuota restringe cuánto de un recurso compartido de Google Cloud en particular puede usar tu proyecto de Google Cloud, incluidos los componentes de red, hardware y software. Por lo tanto, las cuotas son parte de un sistema que hace las siguientes acciones:

  • Supervisa el uso o consumo de productos y servicios de Google Cloud.
  • Restringe el consumo de esos recursos por motivos que incluyen garantizar la equidad y reducir los aumentos repentinos de uso.
  • Mantiene los parámetros de configuración que aplican de forma automática las restricciones prescritas.
  • Proporciona un medio para solicitar o hacer cambios en la cuota.

En la mayoría de los casos, cuando se excede un límite de cuota, el sistema bloquea de inmediato el acceso al recurso de Google correspondiente, y la tarea que intentas hacer falla. En la mayoría de los casos, las cuotas se aplican a cada proyecto de Google Cloud y se comparten entre todas las aplicaciones y direcciones IP que usan ese proyecto.

Para aumentar o disminuir la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita una cuota mayor.

También existen límites para los recursos de GKE. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar, a menos que se indique lo contrario.

Límites por proyecto

En un solo proyecto, puedes crear un máximo de 100 clústeres zonales por zona, más 100 clústeres regionales por región.

Nota: Los clústeres creados en el modo Autopilot están preconfigurados como clústeres regionales.

Límites por clúster

En las siguientes tablas, se describen los límites por clúster de GKE.

Cualquier versión de GKE especificada en la siguiente tabla se aplica a los nodos del clúster y al plano de control.

Límites Clúster de GKE Standard Clúster de GKE Autopilot
Nodos por clúster 15,000 nodos

Nota: Si planeas ejecutar más de 2,000 nodos, usa un clúster regional.

Nota: La ejecución de más de 5,000 nodos solo está disponible para clústeres regionales, privados o con Private Service Connect y con GKE Dataplane V2 inhabilitado. Comunícate con el equipo de asistencia para aumentar este límite de cuota.

5,000 nodos

Nota: Si planeas ejecutar más de 1,000 nodos, usa la versión 1.23 o una posterior de GKE Autopilot.

Nota: Ejecutar más de 400 nodos puede requerir aumentar la cuota de tamaño del clúster para los clústeres que se crearon en versiones anteriores. Comunícate con el equipo de asistencia para recibir ayuda.

Nodos por grupo de nodos 1,000 nodos por zona No aplicable
Nodos en una zona
  • No hay limitaciones de nodos para el balanceo de cargas nativo del contenedor con Ingress basado en NEG, que se recomienda siempre que sea posible. En GKE 1.17 o superior, el Ingress basado en NEG es el modo predeterminado.
  • 1,000 nodos si usas Ingress basado en grupos de instancias.
No aplicable
Pods por nodo1 256 Pods

Nota: Para las versiones de GKE anteriores a 1.23.5-gke.1300, el límite es de 110 Pods.

Se establece de forma dinámica en cualquier valor entre 8 y 256. GKE considera el tamaño del clúster y la cantidad de cargas de trabajo para aprovisionar la cantidad máxima de Pods por nodo.

  • En las versiones de GKE anteriores a la 1.28, el límite es de 32 Pods.
  • Para los Pods de clase acelerador y de clase de rendimiento, el límite es de un Pod por nodo.
Pods por clúster2 200,000 Pods1 200,000 Pods
Contenedores por clúster 400,000 contenedores 400,000 contenedores
Tamaño de la base de datos Etcd 6 GB 6 GB

Como administrador de la plataforma, te recomendamos que te familiarices con la forma en que las cuotas afectan las cargas de trabajo grandes que se ejecutan en GKE. Si deseas obtener recomendaciones adicionales, prácticas recomendadas, límites y cuotas para las cargas de trabajo grandes, consulta Lineamientos para crear clústeres escalables.

Límite para solicitudes a la API

El límite de frecuencia predeterminado para la API de Kubernetes Engine es de 3000 solicitudes por minuto, aplicados a intervalos de 100 segundos.

Cuotas de recursos

En el caso de los clústeres con menos de 100 nodos, GKE aplica la cuota de recursos de Kubernetes a cada espacio de nombres. Estas cuotas protegen el plano de control del clúster de la inestabilidad que generan posibles errores en las aplicaciones que se implementaron en el clúster. No puedes quitar estas cuotas porque GKE las aplica.

GKE actualiza automáticamente los valores de las cuotas de recursos en proporción a la cantidad de nodos. En el caso de los clústeres con más de 100 nodos, GKE quita la cuota de recursos.

Para examinar las cuotas de recursos, usa el siguiente comando:

kubectl get resourcequota gke-resource-quotas -o yaml

Para ver los valores de un espacio de nombres determinado, especifícalo al agregar la opción --namespace.

Comprueba tu cuota

Console

  1. En la consola de Google Cloud, ve a la página Cuotas.

    Ir a Cuotas

  2. En la página Cuotas, se muestra la lista de cuotas filtradas previamente para las cuotas de GKE.
  3. Para buscar la cuota exacta, usa la tabla de filtros. Si no sabes el nombre de la cuota, puedes usar los vínculos de la página Cuotas.

gcloud

  1. Para comprobar tus cuotas, ejecuta el siguiente comando:
    gcloud compute project-info describe --project PROJECT_ID

    Reemplaza PROJECT_ID con el ID de tu proyecto.

  2. Para verificar la cuota usada en una región, ejecuta el siguiente comando:
    gcloud compute regions describe example-region

Notas

  1. La cantidad máxima de Pods por clúster de GKE Standard incluye los Pods del sistema. La cantidad de Pods del sistema varía según la configuración del clúster y las funciones habilitadas.

  2. La cantidad máxima de Pods que puede caber en un nodo depende del tamaño de tus solicitudes de recursos de Pods y de la capacidad del nodo. Es posible que no alcances todos los límites al mismo tiempo. Como recomendación, te sugerimos que realices una prueba de carga de las implementaciones de gran tamaño.