En este documento, se describen las cuotas de asignación que se aplican a Compute Engine.
Cuotas de asignación
Las cuotas de asignación, también conocidas como cuotas de recursos, definen la cantidad de recursos a los que tu proyecto tiene acceso. Compute Engine aplica cuotas de asignación al uso de recursos por diversos motivos. Por ejemplo, las cuotas ayudan a proteger a la comunidad de usuarios de Google Cloud mediante la prevención de aumentos repentinos de uso. Google Cloud también ofrece cuotas de prueba gratuita que proporcionan acceso limitado a los proyectos para que explores Google Cloud gratis.
No todos los proyectos tienen las mismas cuotas. A medida que tu uso de Google Cloud aumenta con el tiempo, tus cuotas pueden aumentar según corresponda. Si prevés un aumento considerable en el uso, puedes solicitar ajustes en la cuota de forma proactiva en la página Cuotas de la consola de Google Cloud.
Si deseas obtener información específica sobre las cuotas para los límites de frecuencia de la API de Compute Engine, consulta la cuota de la API.
Disponibilidad de cuotas y recursos
Las cuotas de asignación son la cantidad máxima de recursos que puedes crear de un tipo de recurso, si este está disponible. Las cuotas no garantizan
que los recursos estén siempre disponibles. Si un recurso no está disponible o si la región que eliges no lo tiene, no podrás crear recursos nuevos de ese tipo, incluso si queda una cuota restante en tu región o proyecto. Por ejemplo, es posible que aún tengas cuota para crear direcciones IP externas en us-central1
, pero quizá no haya direcciones IP disponibles en esa región.
De manera similar, aunque tengas una cuota regional, es posible que un recurso no esté disponible en una zona específica. Por ejemplo, es posible que tengas una cuota para crear instancias de VM en la región us-central1
, pero es posible que no puedas crear estas instancias de VM en la zona us-central1-a
si es que está agotada. En esos casos, prueba crear el mismo recurso en otra zona, como us-central1-f
. Consulta la documentación sobre cómo solucionar problemas de disponibilidad de recursos para obtener más información sobre tus opciones si se agotan los recursos zonales.
Cuotas de asignación
Cuando planificas qué necesita tu instancia de VM, debes tener en cuenta varias cuotas que afectan la cantidad de instancias de VM que puedes crear.
Cuotas regionales y globales
Las cuotas de VM se administran a nivel regional. Cualquier VM en la región puede consumir una instancia de VM, un grupo de instancias, cuotas de disco y CPU, independientemente de la zona. Por ejemplo, la cuota de CPU es una cuota regional, de manera que existe un límite y un recuento de uso diferentes para cada región. Para iniciar una instancia n2-standard-16
en cualquier zona de la región us-central1
, necesitarás tener cuota suficiente para al menos 16 CPU en us-central1
.
Se necesitan cuotas de red y de balanceo de cargas para crear firewalls, balanceadores de cargas, redes y VPN. Estas son cuotas globales que no dependen de una región. Una región puede usar una cuota global. Por ejemplo, las direcciones IP externas estáticas y en uso asignadas a balanceadores de cargas y a proxies HTTP y HTTPS consumen cuotas globales.
Instancias de VM
La cuota de instancias de VM es regional y limita la cantidad de instancias de VM que pueden existir en una región determinada, independientemente de si la VM se está ejecutando o no. Esta cuota se puede ver en la página Cuotas de la consola de Google Cloud. Compute Engine configura esta cuota de forma automática para que sea equivalente a 10 veces tu cuota de CPU normal. No necesitas solicitar esta cuota. Si necesitas cuota para más instancias de VM, solicita más CPU, ya que esto aumentará la cuota de instancias de VM. La cuota se aplica a las VM inactivas y activas, así como a las instancias interrumpibles y normales.
En la consola de Google Cloud, ve a la página Cuotas.
En la lista Filtro de
, selecciona las siguientes opciones:- En Servicio, selecciona API de Compute Engine.
- En Tipo, selecciona Cuota.
- En Nombre, selecciona Instancias de VM.
- Opcional: En Métrica, selecciona cualquier otro nombre de cuota de CPU o CPU comprometida que desees filtrar.
Opcional: Para ordenar la tabla por región, haz clic en la columna Dimensiones (p. ej., ubicación).
Selecciona las regiones cuya cuota deseas cambiar.
Haz clic en
Editar.Completa el formulario.
Haz clic en Enviar solicitud.
Grupos de instancias
A fin de usar grupos de instancias, debes tener cuota disponible para todos los recursos que usará el grupo (por ejemplo, cuota de CPU) y para el mismo recurso de grupo. Las siguientes cuotas de uso de recursos de grupos se aplican según el tipo de grupo que crees:
Tipo de servicio | Cuota de servicio |
---|---|
Grupo de instancias administrado regional (multizona) | Regional instance group managers |
Grupo de instancias administrado zonal (zona única) | Ambos de:
|
Grupo de instancias no administrado (zona única) | Instance groups |
Escalador automático regional (multizona) | Regional autoscalers |
Escalador automático zonal (zona única) | Autoscalers |
Cuotas de disco
Las siguientes cuotas se aplican a Persistent Disk, Hyperdisk y SSD locales por región:
Hyperdisk Balanced Capacity (GB)
: Esta cuota es el tamaño total combinado de los discos Hyperdisk Balanced que puedes crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoHDB-TOTAL-GB
.Hyperdisk Balanced Throughput (MB/s)
: Esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk Balanced de una zona. En gcloud CLI y en la API, se hace referencia a esta cuota comoHDB-TOTAL-THROUGHPUT
.Hyperdisk Balanced IOPS
. Esta cuota es la cantidad total de IOPS que puedes aprovisionar para todos los discos Hyperdisk Balanced en una zona. En gcloud CLI y en la API, se hace referencia a esta cuota comoHDB-TOTAL-IOPS
.Hyperdisk ML Capacity (GB)
: Esta cuota es el tamaño total combinado de los discos Hyperdisk ML que puedes crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoHDML-TOTAL-GB
.Hyperdisk ML Throughput (MB/s)
: Esta cuota es la cantidad total de capacidad de procesamiento que puedes aprovisionar para todos los discos Hyperdisk ML de una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoHDML-TOTAL-THROUGHPUT
.Persistent disk standard (GB)
: esta cuota es el tamaño total de los discos persistentes estándar que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoDISKS_TOTAL_GB
. Esta cuota también se aplica a lo siguiente:- Discos persistentes estándares regionales, pero los discos persistentes regionales consumen el doble de cuota por GiB debido a la replicación en dos zonas de la región.
- Cuando eliges conservar los datos de SSD locales cuando detienes o suspendes una VM, se consume una cantidad equivalente de cuota de disco persistente estándar.
Persistent disk SSD (GB)
: esta cuota es el tamaño total combinado de las particiones de volúmenes de discos persistentes respaldados en SSD que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoSSD_TOTAL_GB
. Esta cuota es independiente de la de los discos SSD locales. La cuota se aplica a los siguientes tipos de discos:- Disco persistente SSD zonal y regional
- Disco persistente balanceado zonal y regional
Los discos persistentes regionales consumen el doble de cuota por GB debido a la replicación en dos zonas de la región.
Persistent Disk IOPS
: Esta cuota es la cantidad total de operaciones de E/S por segundo para los volúmenes de discos persistentes extremos que se pueden crear en una región. En gcloud CLI y en la API, se hace referencia a esta cuota comoPD-EXTREME-TOTAL-PROVISIONED-IOPS
. Esta cuota es independiente de la cuota de IOPS de Google Cloud Hyperdisk.Local SSD per machine family (GB)
Esta cuota es el tamaño total combinado de los discos SSD locales que puedes conectar a las VMs en una región según el tipo de máquina de cada VM. Los SSD locales son discos rápidos y efímeros que deberían utilizarse para instalaciones nuevas, almacenamiento en caché local o trabajos de procesamiento con alta tolerancia a errores, puesto que estos discos no están pensados para soportar los reinicios de la instancia de VM.Los discos SSD locales se venden en incrementos de 375 GiB o 3 TiB, según el tipo de máquina. También hay una cantidad máxima de discos SSD locales que se pueden conectar a una sola VM, según el tipo de máquina. La cantidad máxima de discos SSD locales y el tamaño de cada uno de ellos crean un límite en la cantidad total de capacidad de disco SSD local que puedes asignar a una VM. En gcloud CLI y en la API, se hace referencia a este límite como la cuota de
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
.En el caso de las VMs A3 y A2 ultra, no es necesario que solicites esta cuota, ya que las SSD locales se agregan automáticamente a estas VMs. Sin embargo, deberás solicitar
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
para las otras VMs optimizadas para aceleradores.
Cuotas del grupo de almacenamiento
En cuanto a la capacidad, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de capacidad avanzada tienen las siguientes cuotas, medidas en GB (o 1,000 MB):
Hyperdisk Balanced Storage Pools Advanced Capacity (GB)
: Es la cantidad total de espacio en el disco que puedes reservar por región en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de capacidad avanzado.- gcloud CLI y la API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
- gcloud CLI y la API:
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)
: Es la cantidad total de espacio en el disco que puedes reservar por región en un grupo de almacenamiento de Hyperdisk Throughput con aprovisionamiento de capacidad avanzado.- gcloud CLI y la API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity
- gcloud CLI y la API:
En cuanto al rendimiento, los grupos de almacenamiento de Hyperdisk con aprovisionamiento de rendimiento avanzado tienen las siguientes cuotas:
Hyperdisk Balanced Storage Pools Advanced IOPS
: Es la cantidad total de IOPS que puedes reservar en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.- gcloud CLI y la API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
- gcloud CLI y la API:
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)
: Es la capacidad de procesamiento total que puedes reservar en un grupo de almacenamiento balanceado de Hyperdisk con aprovisionamiento de rendimiento avanzado para una región.- gcloud CLI y la API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
- gcloud CLI y la API:
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)
: Es la capacidad de procesamiento total que puedes reservar en un grupo de almacenamiento de Hyperdisk Throughput con aprovisionamiento de rendimiento avanzado para una región.- gcloud CLI y la API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput
- gcloud CLI y la API:
Límites de cuota de CPU
La cuota de CPU es la cantidad total de CPU virtuales en todas las instancias de VM de una región. Las cuotas de CPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.
Para ayudar a proteger los sistemas de Compute Engine y a otros usuarios, parte de las cuentas y los proyectos nuevos también tendrán una cuota global de CPUs (All Regions)
. Esa cuota se aplica a todas las regiones y se mide como la suma de tus CPU virtuales ubicadas en todas estas.
Por ejemplo, si tienes 48 CPU virtuales restantes en una única región, como us-central1
, pero solo 32 CPU virtuales restantes para la cuota de CPUs (All Regions)
, puedes iniciar solo 32 CPU virtuales en la región us-central1
, aunque haya cuota restante en la región. El motivo es que alcanzas la cuota de CPU (All Regions)
y debes borrar las instancias existentes para poder iniciar nuevas.
Los tipos de máquinas E2 y N1 comparten un grupo de cuotas de CPU. A menos que se indique lo contrario, todos los demás tipos de máquinas tienen grupos de cuotas de CPU únicos.
Si usas descuentos por compromiso de uso para tus VM, debes tener una cuota de descuento por compromiso de uso antes de comprar un contrato de descuento por compromiso de uso.
Tipo de máquina | Grupo de cuota | Nombre de cuota de CPU | Nombre de cuota de CPU por compromiso |
---|---|---|---|
N1 | grupo compartido | CPUS |
Committed_CPUS |
E2 | grupo compartido | CPUS |
Committed_CPUS |
N2 | grupo separado | N2_CPUS |
Committed_N2_CPUS |
N4 | grupo separado | CPUS_PER_VM_FAMILY |
Committed_N4_CPUS |
N2D | grupo separado | N2D_CPUS |
Committed_N2D_CPUS |
T2D | grupo separado | T2D_CPUS |
Committed_T2D_CPUS |
T2A | grupo separado | T2A_CPUS |
No disponible (N/A) para T2A |
Z3 | grupo separado | CPUS_PER_VM_FAMILY |
Committed_Z3_CPUS |
M1 | grupo separado | M1_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M2 | grupo separado | M2_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M3 | grupo separado | M3_CPUS |
Committed_M3_CPUS |
X4 | grupo separado | CPUS_PER_VM_FAMILY |
Committed_X4_CPUS |
H3 | grupo separado | CPUS_PER_VM_FAMILY |
Committed_H3_CPUS |
C2 | grupo separado | C2_CPUS |
Committed_C2_CPUS |
C2D | grupo separado | C2D_CPUS |
Committed_C2D_CPUS |
C3 | grupo separado | C3_CPUS |
Committed_C3_CPUS |
C3D | grupo separado | CPUS_PER_VM_FAMILY |
Committed_C3D_CPUS |
C4 | grupo separado | CPUS_PER_VM_FAMILY |
Committed_C4_CPUS |
C4A | grupo separado | CPUS_PER_VM_FAMILY |
Committed_C4A_CPUS |
A2* | grupo separado | A2_CPUS |
Committed_A2_CPUS |
A3† | No aplicable (N/A) para A3 | No aplicable (N/A) para A3 | No aplicable (N/A) para A3 |
G2† | No aplicable (N/A) para G2 | No aplicable (N/A) para G2 | No aplicable (N/A) para G2 |
VM interrumpibles | grupo compartido | PREEMPTIBLE_CPUS |
No disponible (N/A) para las VM interrumpibles |
*En el caso de las VMs A2, no necesitas solicitar cuotas de CPU. Si tienes las cuotas de GPU NVIDIA A100 requeridas, eso es todo lo que se necesita para crear estas VMs.
†En el caso de las VMs A3 y G2, no se aplican las cuotas de CPU. Si tienes las cuotas de GPU requeridas de NVIDIA H100 y L4, respectivamente, eso es todo lo que se necesita para crear estas VMs.
Cuota de GPU
Al igual que la cuota de CPU virtuales, la cuota de GPU se refiere a la cantidad total de GPU virtuales en todas las instancias de VM de una región. Las cuotas de GPU se aplican a las VM en ejecución y a las reservadas. Tanto las VM predefinidas como las interrumpibles consumen esta cuota.
Consulta la página Cuotas para asegurarte de que tienes suficientes GPU disponibles en el proyecto y solicitar un aumento de la cuota. Además, las cuentas y los proyectos nuevos tienen una cuota de GPU global que se aplica a todas las regiones.
Cuando solicitas una cuota de GPU, debes especificar una cuota de los modelos de GPU que quieres crear en cada región, así como indicar la cuota global (GPUs (all regions)
) con la cantidad total de GPU de los tipos de todas las regiones.
Solicita la cuota de GPU interrumpible para usar esos recursos.
Tipo de máquina | Tipo de GPU | Nombre de la cuota de GPU | Familia de GPU | Nombre de cuota de GPU por compromiso | Estación de trabajo virtual | GPU interrumpibles | Estación de trabajo virtual de GPU interrumpible |
---|---|---|---|---|---|---|---|
A3 Mega | H100 80 GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100_MEGA |
COMMITTED_NVIDIA_H100_MEGA_GPUS |
N/A | PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS |
N/A |
A3 Edge y A3 High | H100 80 GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100 |
COMMITTED_NVIDIA_H100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_H100_GPUS |
N/A |
A2 ultra | A100 80 GB | NVIDIA_A100_80GB_GPUS |
N/A | COMMITTED_NVIDIA_A100_80GB_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_80GB_GPUS |
N/A |
A2 Estándar | A100 40 GB | NVIDIA_A100_GPUS |
N/A | COMMITTED_NVIDIA_A100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_GPUS |
N/A |
G2 | L4 | NVIDIA_L4_GPUS |
N/A | COMMITTED_NVIDIA_L4_GPUS |
NVIDIA_L4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_L4_GPUS |
PREEMPTIBLE_NVIDIA_L4_VWS_GPUS |
N1 | T4 | NVIDIA_T4_GPUS |
N/A | COMMITTED_NVIDIA_T4_GPUS |
NVIDIA_T4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_T4_GPUS |
PREEMPTIBLE_NVIDIA_T4_VWS_GPUS |
V100 | NVIDIA_V100_GPUS |
N/A | COMMITTED_NVIDIA_V100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_V100_GPUS |
N/A | |
P100 | NVIDIA_P100_GPUS |
N/A | COMMITTED_NVIDIA_P100_GPUS |
NVIDIA_P100_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P100_GPUS |
PREEMPTIBLE_NVIDIA_P100_VWS_GPUS |
|
P4 | NVIDIA_P4_GPUS |
N/A | COMMITTED_NVIDIA_P4_GPUS |
NVIDIA_P4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P4_GPUS |
PREEMPTIBLE_NVIDIA_P4_VWS_GPUS |
Cuotas interrumpibles
Puedes solicitar cuotas de recursos interrumpibles para Preemptible CPUs
, Preemptible GPUs
y Preemptible Local SSDs (GB)
. Estas cuotas interrumpibles se aplican a las CPUs, las GPUs y los SSD locales de las siguientes VMs:
Si tu proyecto no tiene una cuota interrumpible y nunca has solicitado una, estos recursos consumen una cuota estándar. Sin embargo, después de que pides una cuota interrumpible en tu proyecto, los recursos aplicables solo pueden consumir una cuota de este tipo y no pueden volver a consumir cuotas estándar.
Solicitar cuotas interrumpibles puede ayudarte a mejorar la disponibilidad de las cuotas, ya que proporciona cuotas independientes para los recursos temporales. Después de que Compute Engine te asigne una cuota de recursos interrumpibles en una región, todos los recursos aplicables consumirán automáticamente esa cuota. Si se agota esta cuota, debes solicitar una cuota interrumpible para esos recursos.
Direcciones IP externas
Debes tener suficientes direcciones IP externas para todas las VM a las que se necesita tener acceso directamente desde la Internet pública. La cuota de IP regionales es para asignar direcciones IPv4 a las VM de esa región. La cuota de IP global se usa para asignar direcciones IPv4 a recursos de red globales, como balanceadores de cargas. Google Cloud ofrece distintos tipos de direcciones IP, en función de tus necesidades. Consulta la sección sobre los precios de las direcciones IP externas para obtener información acerca de los costos. Para obtener más información sobre cuotas específicas, consulta Cuotas y límites.
Direcciones IP externas en uso: Incluye las direcciones IP efímeras y estáticas que usa un recurso.
Direcciones IP externas estáticas: Son direcciones IP externas reservadas para tus recursos que persisten cuando se reinicia la máquina. Puedes registrar estas direcciones con servicios DNS y de proveedor de dominio para proporcionar una dirección fácil de usar. Por ejemplo, www.example-site.com.
Direcciones IP internas estáticas: estas direcciones te permiten reservar direcciones IP internas del rango de IP interna configurado en la subred. Puedes asignar esas direcciones internas reservadas a los recursos según se requiera.
Lanzamientos de cuotas
En ocasiones, Google Cloud cambia la cuota predeterminada para los recursos y las APIs. Estos cambios se aplican de forma gradual. Durante el lanzamiento de una nueva cuota predeterminada, la cuota máxima que aparece en la consola de Google Cloud podría no reflejar la cuota máxima real que tienes disponible.
Por ejemplo, supongamos que Google Cloud cambia la cuota máxima predeterminada para las reglas de firewall de 200
a 300
y usas la consola de Google Cloud para ver la cuota nueva. Es posible que veas la nueva cuota de 300
, aunque tu cuota real sea de 200
, hasta que se complete el lanzamiento.
Para obtener información sobre los lanzamientos de cuotas en curso, consulta los problemas conocidos. Si no se describen problemas, significa que no hay lanzamientos de cuotas en curso.
Si el lanzamiento de una cuota está en curso y deseas confirmar la cuota máxima real que tienes disponible, usa Google Cloud CLI para verificar tu cuota. Si necesitas más cuota de la que tienes acceso, envía una solicitud de aumento de cuota.
¿Qué sigue?
- Obtén información sobre los precios basados en recursos.
- Consulta la página sobre precios de instancias de VM.
- Obtén más información para ver y administrar la cuota.
- Obtén información para configurar alertas de cuota.
- Obtén información para aumentar automáticamente la cuota en función del uso de tus recursos de Compute Engine.