Cuotas de asignación


En este documento, se describen las cuotas de asignación que se aplican a Compute Engine.

Cuotas de asignación

Las cuotas de asignación, también conocidas como cuotas de recursos, definen la cantidad de recursos a los que tiene acceso tu proyecto. Compute Engine aplica cuotas de asignación al uso de recursos por diversos motivos. Por ejemplo, las cuotas ayudan a proteger a la comunidad de usuarios de Google Cloud mediante la prevención de aumentos repentinos de uso. Google Cloud también ofrece cuotas de prueba gratuita que proporcionan acceso limitado a los proyectos para que explores Google Cloud gratis.

No todos los proyectos tienen las mismas cuotas. A medida que tu uso de Google Cloud aumenta con el tiempo, tus cuotas pueden aumentar según corresponda. Si prevés un aumento considerable en el uso, puedes solicitar ajustes en la cuota de forma proactiva en la página Cuotas de la consola de Google Cloud.

Si deseas obtener información específica sobre las cuotas para los límites de frecuencia de la API de Compute Engine, consulta la cuota de API.

Disponibilidad de cuotas y recursos

Las cuotas de asignación son la cantidad máxima de recursos que puedes crear de un tipo de recurso, si este está disponible. Las cuotas no garantizan que los recursos estén siempre disponibles. Si un recurso no está disponible o si la región que eliges no lo tiene, no podrás crear recursos nuevos de ese tipo, incluso si queda una cuota restante en tu región o proyecto. Por ejemplo, es posible que aún tengas cuota para crear direcciones IP externas en us-central1, pero quizá no haya direcciones IP disponibles en esa región.

De manera similar, aunque tengas una cuota regional, es posible que un recurso no esté disponible en una zona específica. Por ejemplo, es posible que tengas una cuota para crear instancias de VM en la región us-central1, pero es posible que no puedas crear estas instancias de VM en la zona us-central1-a si es que está agotada. En esos casos, prueba crear el mismo recurso en otra zona, como us-central1-f. Consulta la documentación sobre cómo solucionar problemas de disponibilidad de recursos para obtener más información sobre tus opciones si se agotan los recursos zonales.

Cuotas de asignación

Cuando planificas qué necesita tu instancia de VM, debes tener en cuenta varias cuotas que afectan la cantidad de instancias de VM que puedes crear.

Cuotas regionales y globales

Las cuotas de VM se administran a nivel regional. Cualquier VM en la región puede consumir una instancia de VM, un grupo de instancias, cuotas de disco y CPU, independientemente de la zona. Por ejemplo, la cuota de CPU es una cuota regional, de manera que existe un límite y un recuento de uso diferentes para cada región. Para iniciar una instancia n2-standard-16 en cualquier zona de la región us-central1, necesitarás tener cuota suficiente para al menos 16 CPU en us-central1.

Se necesitan cuotas de red y de balanceo de cargas para crear firewalls, balanceadores de cargas, redes y VPN. Estas son cuotas globales que no dependen de una región. Una región puede usar una cuota global. Por ejemplo, las direcciones IP externas estáticas y en uso asignadas a balanceadores de cargas y a proxies HTTP(S) consumen cuotas globales.

Instancias de VM

La cuota de instancias de VM es regional y limita la cantidad de instancias de VM que pueden existir en una región determinada, independientemente de si la VM se está ejecutando o no. Esta cuota se puede ver en la página Cuotas de la consola de Google Cloud. Compute Engine configura esta cuota de forma automática para que sea equivalente a 10 veces tu cuota de CPU normal. No necesitas solicitar esta cuota. Si necesitas cuota para más instancias de VM, solicita más CPU, ya que esto aumentará la cuota de instancias de VM. La cuota se aplica a las VM inactivas y activas, así como a las instancias interrumpibles y normales.

  1. En la consola de Google Cloud, ve a la página Cuotas.

    Ir a Cuotas

  2. Haz clic en Tabla de filtros y selecciona Servicio.

  3. Elige API de Compute Engine.

  4. Selecciona Cuota: instancias de VM.

  5. Para ver una lista de las cuotas de tu instancia de VM por región, haz clic en Todas las cuotas. Las cuotas de tu región se muestran desde el uso más alto hasta el más bajo.

  6. Haz clic en la casilla de verificación de la región cuya cuota deseas cambiar.

  7. Haz clic en  Editar cuotas.

  8. Completa el formulario.

  9. Haz clic en Enviar solicitud.

Grupos de instancias

A fin de usar grupos de instancias, debes tener cuota disponible para todos los recursos que usará el grupo (por ejemplo, cuota de CPU) y para el mismo recurso de grupo. Las siguientes cuotas de uso de recursos de grupos se aplican según el tipo de grupo que crees:

Tipo de servicio Cuota de servicio
Grupo de instancias administrado regional (multizona) Regional instance group managers
Grupo de instancias administrado zonal (zona única) Ambos de:
  • Instance group managers
  • Instance groups
Grupo de instancias no administrado (zona única) Instance groups
Escalador automático regional (multizona) Regional autoscalers
Escalador automático zonal (zona única) Autoscalers

Cuotas de disco

Las siguientes cuotas se aplican a los discos persistentes y SSD locales por región:

  • Local SSD per machine family (GB) Esta cuota es el tamaño total combinado de las particiones de discos SSD locales que puedes conectar a las VM en una región según el tipo de máquina de cada VM. Los SSD locales son discos rápidos y efímeros que deberían utilizarse para instalaciones nuevas, almacenamiento en caché local o trabajos de procesamiento con alta tolerancia a errores, puesto que estos discos no están pensados para soportar los reinicios de la instancia de VM. Las particiones de SSD locales se venden en incrementos de 375 GB y se pueden conectar hasta 24 particiones de SSD locales a una sola VM. En la CLI de gcloud y en la API, se hace referencia a esta cuota como LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

  • Persistent disk standard (GB): esta cuota es el tamaño total de los discos persistentes estándar que se pueden crear en una región. Tal como se describe en la sección sobre la optimización del rendimiento de discos persistentes y SSD locales, los discos persistentes estándar ofrecen menos IOPS y capacidad de procesamiento que los discos persistentes SSD o SSD locales Resultan más económicos cuando se usan como grandes discos duraderos para almacenamiento, como discos de arranque y para procesos de escritura en serie, como los registros. Los discos persistentes estándar son duraderos y están disponibles de forma indefinida para conectarse a una VM dentro de la misma zona. En la CLI de gcloud y en la API, se hace referencia a esta cuota como DISKS_TOTAL_GB. Esta cuota también se aplica a los discos persistentes estándar regionales, pero los discos regionales consumen el doble de cuota por GB debido a la replicación en dos zonas de la región.

  • Persistent disk SSD (GB): esta cuota es el tamaño total combinado de las particiones de discos persistentes respaldados en SSD que se pueden crear en una región. Los discos persistentes respaldados en SSD tienen varias réplicas y, como se describe en la sección sobre rendimiento del almacenamiento en bloque, ofrecen más IOPS y capacidad de procesamiento que los discos persistentes estándar. Los discos persistentes respaldados en SSD están disponibles de forma indefinida para conectarse a una VM ubicada en la misma zona. En la CLI de gcloud y en la API, se hace referencia a esta cuota como SSD_TOTAL_GB. Ten en cuenta que esta cuota es distinta de la de SSD locales. La cuota se aplica a los siguientes tipos de discos:

    • Disco persistente SSD zonal y regional
    • Disco persistente balanceado zonal y regional

    Los discos persistentes regionales consumen el doble de cuota por GB debido a la replicación en dos zonas de la región.

Límites de cuota de CPU

La cuota de CPU es la cantidad total de CPU virtuales en todas las instancias de VM de una región. Las cuotas de CPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.

Para ayudar a proteger los sistemas de Compute Engine y a otros usuarios, parte de las cuentas y los proyectos nuevos también tendrán una cuota global de CPUs (All Regions). Esa cuota se aplica a todas las regiones y se mide como la suma de tus CPU virtuales ubicadas en todas estas.

Por ejemplo, si tienes 48 CPU virtuales restantes en una única región, como us-central1, pero solo 32 CPU virtuales restantes para la cuota de CPUs (All Regions), puedes iniciar solo 32 CPU virtuales en la región us-central1, aunque haya cuota restante en la región. El motivo es que alcanzas la cuota de CPU (All Regions) y debes borrar las instancias existentes para poder iniciar nuevas.

Los tipos de máquinas E2 y N1 comparten un grupo de cuotas de CPU. A menos que se indique lo contrario, todos los demás tipos de máquinas tienen grupos de cuotas de CPU únicos.

Si usas descuentos por compromiso de uso para tus VM, debes tener una cuota de descuento por compromiso de uso antes de comprar un contrato de descuento por compromiso de uso.

Tipo de máquina Grupo de cuota Nombre de cuota de CPU Nombre de cuota de CPU por compromiso
N1 grupo compartido CPUS Committed_CPUS
E2 grupo compartido CPUS Committed_E2_CPUS
N2 grupo separado N2_CPUS Committed_N2_CPUS
N2D grupo separado N2D_CPUS Committed_N2D_CPUS
T2D grupo separado T2D_CPUS Committed_T2D_CPUS
T2A grupo separado T2A_CPUS No disponible (N/A) para T2A
Z3 (vista previa) grupo separado CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 grupo separado M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 grupo separado M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 grupo separado M3_CPUS Committed_M3_CPUS
H3 grupo separado CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 grupo separado C2_CPUS Committed_C2_CPUS
C2D grupo separado C2D_CPUS Committed_C2D_CPUS
C3 grupo separado C3_CPUS Committed_C3_CPUS
C3D grupo separado CPUS_PER_VM_FAMILY Committed_C3D_CPUS
VM interrumpibles grupo compartido PREEMPTIBLE_CPUS No disponible (N/A) para las VM interrumpibles

Cuota de GPU

Al igual que la cuota de CPU virtuales, la cuota de GPU se refiere a la cantidad total de GPU virtuales en todas las instancias de VM de una región. Las cuotas de GPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.

Consulta la página Cuotas para asegurarte de que tienes suficientes GPU disponibles en el proyecto y solicitar un aumento de la cuota. Además, las cuentas y los proyectos nuevos tienen una cuota de GPU global que se aplica a todas las regiones.

Cuando solicitas una cuota de GPU, debes especificar una cuota de los modelos de GPU que quieres crear en cada región, así como indicar la cuota global (GPUs (all regions)) con la cantidad total de GPU de los tipos de todas las regiones. Solicita la cuota de GPU interrumpible para usar esos recursos.

NVIDIA Nombre de la cuota de GPU Nombre de cuota de GPU por compromiso Estación de trabajo virtual GPU interrumpibles Estación de trabajo virtual de GPU interrumpible
H100 80 GB NVIDIA_H100_GPUS COMMITTED_NVIDIA_H100_GPUS No disponible PREEMPTIBLE_NVIDIA_H100_GPUS No disponible
A100 40 GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS No disponible PREEMPTIBLE_NVIDIA_A100_GPUS N/A
A100 80 GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS N/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/A
L4 NVIDIA_L4_GPUS COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS N/A PREEMPTIBLE_NVIDIA_V100_GPUS N/A
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS N/A PREEMPTIBLE_NVIDIA_K80_GPUS No disponible

Cuotas de asignación para recursos interrumpibles

A fin de usar CPU interrumpibles, GPU adjuntas a instancias de VM interrumpibles o SSD locales adjuntos a instancias de VM interrumpibles, debes tener cuotas disponibles en tu proyecto para el recurso correspondiente.

Puedes solicitar cuotas de recursos interrumpibles especiales para Preemptible CPUs, Preemptible GPUs o Preemptible Local SSDs (GB). Sin embargo, si tu proyecto no tiene una cuota interrumpible y nunca has solicitado una, puedes consumir una cuota estándar para iniciar recursos interrumpibles.

Después de que Compute Engine te asigne una cuota de recursos interrumpibles en una región, todas las instancias interrumpibles se deducirán automáticamente de esa cuota. A medida que se agota esta cuota, debes solicitar una cuota interrumpible para esos recursos.

Direcciones IP externas

Debes tener suficientes direcciones IP externas para todas las VM a las que se necesita tener acceso directamente desde la Internet pública. La cuota de IP regionales es para asignar direcciones IPv4 a las VM de esa región. La cuota de IP global se usa para asignar direcciones IPv4 a recursos de red globales, como balanceadores de cargas. Google Cloud ofrece distintos tipos de direcciones IP, en función de tus necesidades. Consulta la sección sobre los precios de las direcciones IP externas para obtener información acerca de los costos. Para obtener más información sobre cuotas específicas, consulta Cuotas y límites.

  • Direcciones IP externas en uso: Incluye las direcciones IP efímeras y estáticas que usa un recurso.

  • Direcciones IP externas estáticas: Son direcciones IP externas reservadas para tus recursos que persisten cuando se reinicia la máquina. Puedes registrar estas direcciones con servicios DNS y de proveedor de dominio para proporcionar una dirección fácil de usar. Por ejemplo, www.example-site.com.

  • Direcciones IP internas estáticas: estas direcciones te permiten reservar direcciones IP internas del rango de IP interna configurado en la subred. Puedes asignar esas direcciones internas reservadas a los recursos según se requiera.

Lanzamientos de cuota

En ocasiones, Google Cloud cambia la cuota predeterminada para los recursos y las APIs. Estos cambios se realizan de forma gradual. Durante el lanzamiento de una nueva cuota predeterminada, es posible que la cuota máxima que aparece en la consola de Google Cloud no refleje la cuota máxima real que tienes disponible.

Por ejemplo, supongamos que Google Cloud cambia la cuota máxima predeterminada para las reglas de firewall de 200 a 300 y usas la consola de Google Cloud para ver la cuota nueva. Es posible que veas la nueva cuota de 300, aunque tu cuota real sea de 200, hasta que se complete el lanzamiento.

Para obtener información sobre los lanzamientos de cuota en curso, consulta problemas conocidos. Si no se describen problemas, no hay lanzamientos de cuota en curso.

Si el lanzamiento de una cuota está en curso y deseas confirmar la cuota máxima real que tienes disponible, usa Google Cloud CLI para verificar tu cuota. Si necesitas más cuota de la que tienes acceso, envía una solicitud de aumento de cuota.

¿Qué sigue?