Cuotas

En este documento, se enumeran las cuotas que se aplican a Cloud TPU. Si quieres obtener más información sobre los precios de Cloud TPU, consulta Precios de Cloud TPU.

Una cuota restringe cuánto de un recurso compartido de Google Cloud en particular puede usar tu proyecto de Google Cloud, incluidos los componentes de red, hardware y software. Por lo tanto, las cuotas son parte de un sistema que hace las siguientes acciones:

  • Supervisa el uso o consumo de productos y servicios de Google Cloud.
  • Restringe el consumo de esos recursos por motivos que incluyen garantizar la equidad y reducir los aumentos repentinos de uso.
  • Mantiene los parámetros de configuración que aplican de forma automática las restricciones prescritas.
  • Proporciona un medio para solicitar o hacer cambios en la cuota.

En la mayoría de los casos, cuando se excede un límite de cuota, el sistema bloquea de inmediato el acceso al recurso de Google correspondiente, y la tarea que intentas hacer falla. En la mayoría de los casos, las cuotas se aplican a cada proyecto de Google Cloud y se comparten entre todas las aplicaciones y direcciones IP que usan ese proyecto.

Asignación de cuotas

La cuota se otorga de manera diferente según la versión de TPU que uses.

TPU v4 y v5p

Para TPU v4 y v5p, la cuota se puede especificar en términos de chips de Cloud TPU o TensorCores. Todas las TPU v4 y v5p se tratan como porciones, por lo que no existe el concepto de un solo dispositivo de TPU, como sucede con las TPU v2 y v3. Puedes usar la cuota en cualquier combinación de porciones. Por ejemplo, si tienes cuota para una porción v4-32, puedes usarla para crear cuatro porciones v4-8.

TPU v5e (entrenamiento e inferencia)

v5e admite tanto el entrenamiento como la inferencia. Crear una instancia v5e para inferencia (v5litepod-1, v5litepod-4, v5litepod-8) requiere tipos de cuota de entrega: tpu-v5s-litepod-serving para TPU a pedido, tpu-v5s-litepod-serving-preemptible para TPU interrumpibles y tpu-v5s-litepod-serving-reserved para TPU reservadas.

TPU v2 y v3

Para TPU v2 y v3, la cuota se especifica en términos de TensorCores. Cada dispositivo de Cloud TPU está compuesto por cuatro chips TPU y ocho TensorCores, dos TensorCores por chip TPU. TPU v2 y v3 tienen cuotas independientes para dispositivos individuales y para pods de TPU. No puedes usar una cuota de pod de TPU v2 o v3 para las TPU v2-8 o v3-8. Por ejemplo, si tienes cuota para una porción v3-32, no puedes usarla a fin de crear cuatro TPU v3-8.

Para obtener más información sobre los chips TPU y los TensorCores, consulta Arquitectura de los sistemas de TPU.

Tipos de cuotas

Existen cuotas independientes para los recursos de Cloud TPU reservados, a pedido y interrumpibles. En la siguiente tabla, se comparan las características de cada tipo de cuota.

Tipo de cuota Descripción Valor predeterminado Cómo solicitarlo Marcas para la creación de TPU
Reservado Cuota para TPU reservadas. Una reserva proporciona un alto nivel de garantía para obtener la capacidad de Cloud TPU. Las instancias reservadas están protegidas contra el agotamiento de stock, pero están sujetas a interrupciones. Debes tener un descuento por compromiso de uso (CUD) para acceder a los recursos reservados. 0 Para solicitar una reserva, completa el formulario de registro de Cloud TPU. Usa la marca --reserved.
Según demanda Cuota para las TPU que no están reservadas y que no se interrumpirán. Puedes solicitar hasta tu límite de cuota de recursos de Cloud TPU, pero no se garantiza la disponibilidad de los recursos. v3-8 y v2-8: 16 TensorCores
Todos los demás: 0
Consulta Cómo solicitar una cuota adicional. No se necesitan marcas; están seleccionadas de forma predeterminada.
Interrumpible Cuota para TPU interrumpibles. El servicio de Cloud TPU puede cerrar estas TPU en cualquier momento si requiere recursos adicionales para trabajos de mayor prioridad. La disponibilidad de los recursos no está garantizada. Para obtener más información, consulta TPU interrumpibles. v3-8 y v2-8: 48 TensorCores
Todos los demás: 0
Consulta Cómo solicitar una cuota adicional. Usa las marcas --preemptible o --best-effort para la solicitud de recurso en cola.

Ver y solicitar cuota adicional

Puedes ver la cuota asignada a tu proyecto de Google Cloud en la página Cuotas de la consola de Google Cloud. Si necesitas una cuota adicional de Cloud TPU, puedes solicitarla en la página Cuotas. Para obtener más información, consulta Cómo solicitar un límite de cuota mayor.