Cuotas

En este documento, se enumeran las cuotas que se aplican a Cloud TPU. Si quieres obtener más información sobre los precios de Cloud TPU, consulta Precios de Cloud TPU.

Una cuota restringe cuánto de un recurso compartido de Google Cloud en particular puede usar tu proyecto de Google Cloud, incluidos los componentes de red, hardware y software. Por lo tanto, las cuotas son parte de un sistema que hace las siguientes acciones:

  • Supervisa el uso o consumo de productos y servicios de Google Cloud.
  • Restringe el consumo de esos recursos por motivos que incluyen garantizar la equidad y reducir los aumentos repentinos de uso.
  • Mantiene los parámetros de configuración que aplican de forma automática las restricciones prescritas.
  • Proporciona un medio para solicitar o hacer cambios en la cuota.

En la mayoría de los casos, cuando se excede un límite de cuota, el sistema bloquea de inmediato el acceso al recurso de Google correspondiente, y la tarea que intentas hacer falla. En la mayoría de los casos, las cuotas se aplican a cada proyecto de Google Cloud y se comparten entre todas las aplicaciones y direcciones IP que usan ese proyecto.

Tipos de cuotas

Si usas GKE, consulta Asegúrate de tener cuota suficiente para obtener más información sobre la cuota de GKE. Cuando utilizas la cuota de la API de Cloud TPU, hay cuotas independientes para los recursos de Cloud TPU reservados, interrumpibles y a pedido. En la siguiente tabla, se compara cada tipo de cuota.

Tipo de cuota Descripción Valor predeterminado Cómo solicitarlo Marcas para la creación de TPU
Reservado La cantidad de recursos de Cloud TPU a los que tienes acceso garantizado. Debes tener un acuerdo de reserva para acceder a los recursos reservados. Los recursos reservados están protegidos contra el agotamiento, pero están sujetos a interrupciones. 0 Para solicitar una cuota reservada, comunícate con tu representante de cuenta de Google Cloud. Usa la marca --reserved.
A pedido La cantidad de recursos a pedido a los que tienes acceso. Los recursos según demanda no se interrumpirán, pero las cuotas según demanda no garantizan que haya suficientes recursos de Cloud TPU disponibles para satisfacer tu solicitud. v3-8 y v2-8: 16 TensorCores
Todos los demás: 0
Consulta Cómo solicitar una cuota adicional. No se necesitan marcas; están seleccionadas de forma predeterminada.
Interrumpible La cantidad de recursos de Cloud TPU interrumpibles a los que tienes acceso. Los recursos interrumpibles se pueden interrumpir para hacer lugar a trabajos de mayor prioridad. La cuota de recursos interrumpibles no garantiza que haya suficientes recursos de Cloud TPU disponibles para satisfacer la solicitud. Para obtener más información, consulta TPU interrumpibles. v3-8 y v2-8: 48 TensorCores
Todos los demás: 0
Consulta Cómo solicitar una cuota adicional. Usa las marcas --preemptible o --best-effort para la solicitud de recurso en cola.

Asignación de cuotas

La cuota de Cloud TPU se otorga de manera diferente según la versión de las TPU que uses.

TPU v4 y v5p

Para TPU v4 y v5p, la cuota se puede especificar en términos de chips TPU o TensorCores. Puedes usar la cuota en cualquier combinación de porciones. Por ejemplo, si tienes una cuota para una porción v4-32, puedes utilizarla para crear cuatro porciones v4-8.

TPU v5e (entrenamiento e inferencia)

v5e admite tanto el entrenamiento como la inferencia. Las porciones v5e que se usan para la inferencia incluyen TPU con tipos de acelerador v5litepod-1, v5litepod-4 o v5litepod-8. Necesitas una cuota de tpu-v5s-litepod-serving para Cloud TPU a pedido, tpu-v5s-litepod-serving-preemptible para Cloud TPU interrumpible y tpu-v5s-litepod-serving-reserved para Cloud TPU reservada.

TPU v2 y v3

La cuota de TPU v2 y v3 se especifica en términos de TensorCores. Un solo dispositivo de TPU contiene cuatro chips TPU y ocho TensorCores (dos TensorCores por chip). Las TPU v2 y v3 tienen cuotas separadas para dispositivos de TPU única y pods de TPU. No puedes usar la cuota de pod de TPU v2 o v3 para las TPU v2-8 o v3-8. Por ejemplo, si tienes una cuota para una porción v3-32, no puedes usarla para crear cuatro TPU v3-8.

Para obtener más información sobre los chips TPU y los TensorCores, consulta Arquitectura de los sistemas de TPU.

Ver y solicitar cuota adicional

Puedes ver la cuota asignada a tu proyecto de Google Cloud en la página Cuotas de la consola de Google Cloud. Si necesitas una cuota adicional de Cloud TPU, puedes solicitarla en la página Cuotas. Para obtener más información, consulta Cómo solicitar un límite de cuota mayor.