Cuotas de asignación


En este documento, se describen las cuotas de asignación que se aplican a Compute Engine.

Cuotas de asignación

Las cuotas de asignación, también conocidas como cuotas de recursos, definen la cantidad de recursos a los que tu proyecto tiene acceso. Compute Engine aplica cuotas de asignación al uso de recursos por diversos motivos. Por ejemplo, las cuotas ayudan a proteger a la comunidad de usuarios de Google Cloud mediante la prevención de aumentos repentinos de uso. Google Cloud también ofrece cuotas de prueba gratuita que proporcionan acceso limitado a los proyectos para que explores Google Cloud gratis.

No todos los proyectos tienen las mismas cuotas. A medida que tu uso de Google Cloud aumenta con el tiempo, tus cuotas pueden aumentar según corresponda. Si prevés un aumento considerable en el uso, puedes solicitar ajustes en la cuota de forma proactiva en la página Cuotas de la consola de Google Cloud.

Si deseas obtener información específica sobre las cuotas para los límites de frecuencia de la API de Compute Engine, consulta la cuota de la API.

Disponibilidad de cuotas y recursos

Las cuotas de asignación son la cantidad máxima de recursos que puedes crear de un tipo de recurso, si este está disponible. Las cuotas no garantizan que los recursos estén siempre disponibles. Si un recurso no está disponible o si la región que eliges no lo tiene, no podrás crear recursos nuevos de ese tipo, incluso si queda una cuota restante en tu región o proyecto. Por ejemplo, es posible que aún tengas cuota para crear direcciones IP externas en us-central1, pero quizá no haya direcciones IP disponibles en esa región.

De manera similar, aunque tengas una cuota regional, es posible que un recurso no esté disponible en una zona específica. Por ejemplo, es posible que tengas una cuota para crear instancias de VM en la región us-central1, pero es posible que no puedas crear estas instancias de VM en la zona us-central1-a si es que está agotada. En esos casos, prueba crear el mismo recurso en otra zona, como us-central1-f. Consulta la documentación sobre cómo solucionar problemas de disponibilidad de recursos para obtener más información sobre tus opciones si se agotan los recursos zonales.

Cuotas de asignación

Cuando planificas qué necesita tu instancia de VM, debes tener en cuenta varias cuotas que afectan la cantidad de instancias de VM que puedes crear.

Cuotas regionales y globales

Las cuotas de VM se administran a nivel regional. Cualquier VM en la región puede consumir una instancia de VM, un grupo de instancias, cuotas de disco y CPU, independientemente de la zona. Por ejemplo, la cuota de CPU es una cuota regional, de manera que existe un límite y un recuento de uso diferentes para cada región. Para iniciar una instancia n2-standard-16 en cualquier zona de la región us-central1, necesitarás tener cuota suficiente para al menos 16 CPU en us-central1.

Se necesitan cuotas de red y de balanceo de cargas para crear firewalls, balanceadores de cargas, redes y VPN. Estas son cuotas globales que no dependen de una región. Una región puede usar una cuota global. Por ejemplo, las direcciones IP externas estáticas y en uso asignadas a balanceadores de cargas y a proxies HTTP y HTTPS consumen cuotas globales.

Instancias de VM

La cuota de instancias de VM es regional y limita la cantidad de instancias de VM que pueden existir en una región determinada, independientemente de si la VM se está ejecutando o no. Esta cuota se puede ver en la página Cuotas de la consola de Google Cloud. Compute Engine configura esta cuota de forma automática para que sea equivalente a 10 veces tu cuota de CPU normal. No necesitas solicitar esta cuota. Si necesitas cuota para más instancias de VM, solicita más CPU, ya que esto aumentará la cuota de instancias de VM. La cuota se aplica a las VM inactivas y activas, así como a las instancias interrumpibles y normales.

  1. En la consola de Google Cloud, ve a la página Cuotas.

    Ir a Cuotas

  2. En la lista Filtro de , selecciona las siguientes opciones:

    • En Servicio, selecciona API de Compute Engine.
    • En Tipo, selecciona Cuota.
    • En Nombre, selecciona Instancias de VM.
    • Opcional: En Métrica, selecciona cualquier otro nombre de cuota de CPU o CPU comprometida que desees filtrar.
  3. Opcional: Para ordenar la tabla por región, haz clic en la columna Dimensiones (p. ej., ubicación).

  4. Selecciona las regiones cuya cuota deseas cambiar.

  5. Haz clic en  Editar.

  6. Completa el formulario.

  7. Haz clic en Enviar solicitud.

Grupos de instancias

A fin de usar grupos de instancias, debes tener cuota disponible para todos los recursos que usará el grupo (por ejemplo, cuota de CPU) y para el mismo recurso de grupo. Las siguientes cuotas de uso de recursos de grupos se aplican según el tipo de grupo que crees:

Tipo de servicio Cuota de servicio
Grupo de instancias administrado regional (multizona) Regional instance group managers
Grupo de instancias administrado zonal (zona única) Ambos de:
  • Instance group managers
  • Instance groups
Grupo de instancias no administrado (zona única) Instance groups
Escalador automático regional (multizona) Regional autoscalers
Escalador automático zonal (zona única) Autoscalers

Cuotas de disco

Las siguientes cuotas se aplican a Persistent Disk, Hyperdisk y SSD locales por región:

  • Hyperdisk Balanced Capacity (GB): Esta cuota es el tamaño total combinado de los discos Hyperdisk Balanced que puedes crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota como HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s): Esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk Balanced de una zona. En gcloud CLI y en la API, se hace referencia a esta cuota como HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS. Esta cuota es la cantidad total de IOPS que puedes aprovisionar para todos los discos Hyperdisk Balanced en una zona. En gcloud CLI y en la API, se hace referencia a esta cuota como HDB-TOTAL-IOPS.
  • Hyperdisk ML Capacity (GB): Esta cuota es el tamaño total combinado de los discos Hyperdisk ML que puedes crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota como HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s): Esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk ML de una región. En gcloud CLI y en la API, se hace referencia a esta cuota como HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB): esta cuota es el tamaño total de los discos persistentes estándar que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota como DISKS_TOTAL_GB. Esta cuota también se aplica a lo siguiente:
    • Discos persistentes estándares regionales, pero los discos persistentes regionales consumen el doble de cuota por GiB debido a la replicación en dos zonas de la región.
    • Cuando eliges conservar los datos de SSD locales cuando detienes o suspendes una VM, se consume una cantidad equivalente de cuota de disco persistente estándar.
  • Persistent disk SSD (GB): esta cuota es el tamaño total combinado de las particiones de volúmenes de discos persistentes respaldados en SSD que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota como SSD_TOTAL_GB. Esta cuota es independiente de la de los discos SSD locales. La cuota se aplica a los siguientes tipos de discos:

    • Disco persistente SSD zonal y regional
    • Disco persistente balanceado zonal y regional

    Los discos persistentes regionales consumen el doble de cuota por GB debido a la replicación en dos zonas de la región.

  • Persistent Disk IOPS: Esta cuota es la cantidad total de operaciones de E/S por segundo para los volúmenes de discos persistentes extremos que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota como PD-EXTREME-TOTAL-PROVISIONED-IOPS. Esta cuota es independiente de la cuota de IOPS de Google Cloud Hyperdisk.

  • Local SSD per machine family (GB) Esta cuota es el tamaño total combinado de los discos SSD locales que puedes conectar a las VMs en una región según el tipo de máquina de cada VM. Los SSD locales son discos rápidos y efímeros que deberían utilizarse para instalaciones nuevas, almacenamiento en caché local o trabajos de procesamiento con alta tolerancia a errores, puesto que estos discos no están pensados para soportar los reinicios de la instancia de VM.

    Los discos SSD locales se venden en incrementos de 375 GiB o 3 TiB, según el tipo de máquina. También hay una cantidad máxima de discos SSD locales que se pueden conectar a una sola VM, según el tipo de máquina. La cantidad máxima de discos SSD locales y el tamaño de cada uno de ellos crean un límite en la cantidad total de capacidad de disco SSD local que puedes asignar a una VM. En gcloud CLI y en la API, se hace referencia a este límite como la cuota de LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    En el caso de las VMs A3 y A2 ultra, no es necesario que solicites esta cuota, ya que las SSD locales se agregan automáticamente a estas VMs. Sin embargo, deberás solicitar LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para las otras VMs optimizadas para aceleradores.

Cuotas del grupo de almacenamiento

En cuanto a la capacidad, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de capacidad avanzada tienen las siguientes cuotas, medidas en GB (o 1,000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): Es la cantidad total de espacio en el disco que puedes reservar por región en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de capacidad avanzado.

    • gcloud CLI y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): Es la cantidad total de espacio en el disco que puedes reservar por región en un grupo de almacenamiento de Hyperdisk Throughput con aprovisionamiento de capacidad avanzado.

    • gcloud CLI y la API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

En cuanto al rendimiento, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de rendimiento avanzado tienen las siguientes cuotas:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: Es la cantidad total de IOPS que puedes reservar en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.

    • gcloud CLI y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): Es la capacidad de procesamiento total que puedes reservar en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.

    • gcloud CLI y la API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): Es la capacidad de procesamiento total que puedes reservar en un grupo de almacenamiento de Hyperdisk Throughput con aprovisionamiento de rendimiento avanzado para una región.

    • gcloud CLI y la API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Límites de cuota de CPU

La cuota de CPU es la cantidad total de CPU virtuales en todas las instancias de VM de una región. Las cuotas de CPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.

Para ayudar a proteger los sistemas de Compute Engine y a otros usuarios, parte de las cuentas y los proyectos nuevos también tendrán una cuota global de CPUs (All Regions). Esa cuota se aplica a todas las regiones y se mide como la suma de tus CPU virtuales ubicadas en todas estas.

Por ejemplo, si tienes 48 CPU virtuales restantes en una única región, como us-central1, pero solo 32 CPU virtuales restantes para la cuota de CPUs (All Regions), puedes iniciar solo 32 CPU virtuales en la región us-central1, aunque haya cuota restante en la región. El motivo es que alcanzas la cuota de CPU (All Regions) y debes borrar las instancias existentes para poder iniciar nuevas.

Los tipos de máquinas E2 y N1 comparten un grupo de cuotas de CPU. A menos que se indique lo contrario, todos los demás tipos de máquinas tienen grupos de cuotas de CPU únicos.

Si usas descuentos por compromiso de uso para tus VM, debes tener una cuota de descuento por compromiso de uso antes de comprar un contrato de descuento por compromiso de uso.

Tipo de máquina Grupo de cuota Nombre de cuota de CPU Nombre de cuota de CPU por compromiso
N1 grupo compartido CPUS Committed_CPUS
E2 grupo compartido CPUS Committed_CPUS
N2 grupo separado N2_CPUS Committed_N2_CPUS
N4 grupo separado CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D grupo separado N2D_CPUS Committed_N2D_CPUS
T2D grupo separado T2D_CPUS Committed_T2D_CPUS
T2A grupo separado T2A_CPUS No disponible (N/A) para T2A
Z3 grupo separado CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 grupo separado M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 grupo separado M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 grupo separado M3_CPUS Committed_M3_CPUS
X4 grupo separado CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 grupo separado CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 grupo separado C2_CPUS Committed_C2_CPUS
C2D grupo separado C2D_CPUS Committed_C2D_CPUS
C3 grupo separado C3_CPUS Committed_C3_CPUS
C3D grupo separado CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 grupo separado CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A grupo separado CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2* grupo separado A2_CPUS Committed_A2_CPUS
A3 No aplicable (N/A) para A3 No aplicable (N/A) para A3 No aplicable (N/A) para A3
G2 No aplicable (N/A) para G2 No aplicable (N/A) para G2 No aplicable (N/A) para G2
VM interrumpibles grupo compartido PREEMPTIBLE_CPUS No disponible (N/A) para las VM interrumpibles

*En el caso de las VMs A2, no necesitas solicitar cuotas de CPU. Si tienes las cuotas de GPU NVIDIA A100 requeridas, eso es todo lo que se necesita para crear estas VMs.

En el caso de las VMs A3 y G2, no se aplican las cuotas de CPU. Si tienes las cuotas de GPU requeridas de NVIDIA H100 y L4, respectivamente, eso es todo lo que se necesita para crear estas VMs.

Cuota de GPU

Al igual que la cuota de CPU virtuales, la cuota de GPU se refiere a la cantidad total de GPU virtuales en todas las instancias de VM de una región. Las cuotas de GPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.

Consulta la página Cuotas para asegurarte de que tienes suficientes GPU disponibles en el proyecto y solicitar un aumento de la cuota. Además, las cuentas y los proyectos nuevos tienen una cuota de GPU global que se aplica a todas las regiones.

Cuando solicitas una cuota de GPU, debes especificar una cuota de los modelos de GPU que quieres crear en cada región, así como indicar la cuota global (GPUs (all regions)) con la cantidad total de GPU de los tipos de todas las regiones. Solicita la cuota de GPU interrumpible para usar esos recursos.

Tipo de máquina Tipo de GPU Nombre de la cuota de GPU Familia de GPU Nombre de cuota de GPU por compromiso Estación de trabajo virtual GPU interrumpibles Estación de trabajo virtual de GPU interrumpible
A3 Mega H100 80 GB GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS N/A PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS N/A
A3 Edge y A3 High H100 80 GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS N/A PREEMPTIBLE_NVIDIA_H100_GPUS N/A
A2 ultra A100 80 GB NVIDIA_A100_80GB_GPUS N/A COMMITTED_NVIDIA_A100_80GB_GPUS N/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/A
A2 Estándar A100 40 GB NVIDIA_A100_GPUS N/A COMMITTED_NVIDIA_A100_GPUS N/A PREEMPTIBLE_NVIDIA_A100_GPUS N/A
G2 L4 NVIDIA_L4_GPUS N/A COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS N/A COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS N/A COMMITTED_NVIDIA_V100_GPUS N/A PREEMPTIBLE_NVIDIA_V100_GPUS N/A
P100 NVIDIA_P100_GPUS N/A COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS N/A COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Cuotas interrumpibles

Puedes solicitar cuotas de recursos interrumpibles para Preemptible CPUs, Preemptible GPUs y Preemptible Local SSDs (GB). Estas cuotas interrumpibles se aplican a las CPUs, las GPUs y los SSD locales de las siguientes VMs:

Si tu proyecto no tiene una cuota interrumpible y nunca has solicitado una, estos recursos consumen una cuota estándar. Sin embargo, después de que pides una cuota interrumpible en tu proyecto, los recursos aplicables solo pueden consumir una cuota de este tipo y no pueden volver a consumir cuotas estándar.

Solicitar cuotas interrumpibles puede ayudarte a mejorar la disponibilidad de las cuotas, ya que proporciona cuotas independientes para los recursos temporales. Después de que Compute Engine te asigne una cuota de recursos interrumpibles en una región, todos los recursos aplicables consumirán automáticamente esa cuota. Si se agota esta cuota, debes solicitar una cuota interrumpible para esos recursos.

Direcciones IP externas

Debes tener suficientes direcciones IP externas para todas las VM a las que se necesita tener acceso directamente desde la Internet pública. La cuota de IP regionales es para asignar direcciones IPv4 a las VM de esa región. La cuota de IP global se usa para asignar direcciones IPv4 a recursos de red globales, como balanceadores de cargas. Google Cloud ofrece distintos tipos de direcciones IP, en función de tus necesidades. Consulta la sección sobre los precios de las direcciones IP externas para obtener información acerca de los costos. Para obtener más información sobre cuotas específicas, consulta Cuotas y límites.

  • Direcciones IP externas en uso: Incluye las direcciones IP efímeras y estáticas que usa un recurso.

  • Direcciones IP externas estáticas: Son direcciones IP externas reservadas para tus recursos que persisten cuando se reinicia la máquina. Puedes registrar estas direcciones con servicios DNS y de proveedor de dominio para proporcionar una dirección fácil de usar. Por ejemplo, www.example-site.com.

  • Direcciones IP internas estáticas: estas direcciones te permiten reservar direcciones IP internas del rango de IP interna configurado en la subred. Puedes asignar esas direcciones internas reservadas a los recursos según se requiera.

Lanzamientos de cuotas

En ocasiones, Google Cloud cambia la cuota predeterminada para los recursos y las APIs. Estos cambios se aplican de forma gradual. Durante el lanzamiento de una nueva cuota predeterminada, la cuota máxima que aparece en la consola de Google Cloud podría no reflejar la cuota máxima real que tienes disponible.

Por ejemplo, supongamos que Google Cloud cambia la cuota máxima predeterminada para las reglas de firewall de 200 a 300 y usas la consola de Google Cloud para ver la cuota nueva. Es posible que veas la nueva cuota de 300, aunque tu cuota real sea de 200, hasta que se complete el lanzamiento.

Para obtener información sobre los lanzamientos de cuotas en curso, consulta los problemas conocidos. Si no se describen problemas, significa que no hay lanzamientos de cuotas en curso.

Si el lanzamiento de una cuota está en curso y deseas confirmar la cuota máxima real que tienes disponible, usa Google Cloud CLI para verificar tu cuota. Si necesitas más cuota de la que tienes acceso, envía una solicitud de aumento de cuota.

¿Qué sigue?