Cuotas de Cloud TPU
En este documento, se enumeran las cuotas que se aplican a Cloud TPU. Para obtener información sobre los precios de Cloud TPU, consulta Precios de Cloud TPU.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso de Google Cloud que puede usar tu proyecto de Google Cloud. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios de Google Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud.
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa el consumo de productos y servicios de Google Cloud.
- Restringe el consumo de esos recursos.
- Proporciona un medio para solicitar cambios en el valor de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
.Cuota de TPU
Existen diferentes cuotas para cada versión de TPU. Por ejemplo, hay diferentes cuotas para las TPU v2, v3, etcétera. Para cada versión de TPU, hay diferentes tipos de cuotas: bajo demanda y preemptibles (VMs Spot). En la siguiente tabla, se describen los diferentes tipos de cuotas.
Tipo de cuota | Descripción | Valor predeterminado | Cómo solicitar | Marcas para la creación de TPU |
---|---|---|---|---|
A pedido | Es la cantidad de recursos on demand a los que tienes acceso. No se apropiarán los recursos según demanda, pero la cuota según demanda no garantiza que haya suficientes recursos de Cloud TPU disponibles para satisfacer tu solicitud. |
v3-8 y v2-8: 16 TensorCores Todos los demás: 0 |
Consulta Solicita cuota adicional. | No se necesitan marcas, se seleccionan de forma predeterminada. |
Interrumpible | La cantidad de recursos de Cloud TPU interrumpibles a los que tienes acceso Esta cuota se aplica a las TPU interrumpibles y a las VMs Spot de TPU. Es posible que se quiten los recursos preemptibles para dejar espacio para trabajos de mayor prioridad. La cuota interrumpible no garantiza que haya suficientes recursos de Cloud TPU disponibles para satisfacer tu solicitud. Para obtener más información, consulta TPU interrumpibles y Administra VMs Spot de TPU. |
v3-8 y v2-8: 48 TensorCores Todos los demás: 0 |
Consulta Solicita cuota adicional. |
|
Las cuotas de TPU se especifican en términos de núcleos de TPU por proyecto y por zona, o bien por proyecto y por región.
Cuotas de TPU v5p
Puedes usar tu cuota de TPU v5p en cualquier combinación de núcleos. Por ejemplo, si tienes una cuota de 32 núcleos, puedes usarla para crear cuatro fragmentos de TPU, cada uno con 8 núcleos.
Cuotas interrumpibles:
- Núcleos interrumpibles de TPU v5p por proyecto y por región
- Núcleos interrumpibles de TPU v5p por proyecto y por zona
Cuotas a pedido:
- Núcleos de TPU v5p por proyecto y por región
- Núcleos de TPU v5p por proyecto y por zona
Cuotas de TPU v5e
Las TPU v5e se pueden usar para el entrenamiento y la entrega. Hay cuotas separadas para el entrenamiento y la publicación, así como para un solo host (núcleos ligeros) y varios hosts (núcleos de pod ligeros).
Cuotas de publicación
Cuotas de publicación interrumpibles:
- Núcleos de pods de TPU v5 lite interrumpibles para la publicación por proyecto y por región
- Núcleos de pod de TPU v5 lite interrumpibles para la publicación por proyecto y por zona
Cuotas de publicación a pedido:
- Núcleos de pods de TPU v5 lite para la publicación por proyecto y por región
- Núcleos de pod de TPU v5 lite para la publicación por proyecto y por zona
Cuotas de entrenamiento
Cuotas de entrenamiento interrumpibles:
- Núcleos de TPU v5 lite interrumpibles por proyecto y por región
- Núcleos de TPU v5 lite interrumpibles por proyecto y por zona
- Núcleos de pod de TPU v5 Lite interrumpibles por proyecto y por región
- Núcleos de pod de TPU v5 Lite interrumpibles por proyecto y por zona
Cuotas de capacitación a pedido:
- Núcleos de TPU v5 Lite por proyecto y por región
- Núcleos de TPU v5 Lite por proyecto y por zona
- Núcleos de pod de TPU v5 Lite por proyecto y por región
- Núcleos de pod de TPU v5 lite por proyecto y por zona
Cuotas de TPU v4
Puedes usar tu cuota de TPU v4 en cualquier combinación de núcleos. Por ejemplo, si tienes una cuota de 32 núcleos, puedes usarla para crear cuatro fragmentos de TPU, cada uno con 8 núcleos.
Cuotas interrumpibles:
- Núcleos de pod de TPU v4 interrumpibles por proyecto y por región
- Núcleos de pod de TPU v4 interrumpibles por proyecto y por zona
Cuotas a pedido:
- Núcleos de pod de TPU v4 por proyecto y por región
- Núcleos de pod de TPU v4 por proyecto y por zona
Cuotas de TPU v3
Hay cuotas de TPU v3 independientes para TPU de host único (núcleo) y TPU de varios hosts (grupo). Debes usar cuotas de pods de v3 para crear TPU con más de 8 núcleos.
Cuotas interrumpibles:
- Núcleos interrumpibles de TPU v3 por proyecto y por región
- Núcleos interrumpibles de TPU v3 por proyecto y por zona
- Núcleos de pod de TPU v3 interrumpibles por proyecto y por región
- Núcleos de pod de TPU v3 interrumpibles por proyecto y por zona
Cuotas a pedido:
- Núcleos de TPU v3 por proyecto y por región
- Núcleos de TPU v3 por proyecto y por zona
- Núcleos de pods de TPU v3 por proyecto y por región
- Núcleos de pod de TPU v3 por proyecto y por zona
Cuotas de TPU v2
Hay cuotas de TPU v2 independientes para las TPU de host único (núcleo) y las TPU de varios hosts (grupo).
Cuotas interrumpibles:
- Núcleos interrumpibles de TPU v2 por proyecto y por región
- Núcleos interrumpibles de TPU v2 por proyecto y por zona
- Núcleos de pod de TPU v2 interrumpibles por proyecto y por región
- Núcleos de pod de TPU v2 interrumpibles por proyecto y por zona
Cuotas a pedido:
- Núcleos de TPU v2 por proyecto y por región
- Núcleos de TPU v2 por proyecto y por zona
- Núcleos de pods de TPU v2 por proyecto y por región
- Núcleos de pod de TPU v2 por proyecto y por zona
Para obtener más información sobre los chips TPU y los TensorCores, consulta Arquitectura del sistema de TPU.
Consulta y solicita una cuota adicional
Puedes ver la cuota asignada a tu proyecto de Google Cloud en la página Cuotas de la consola de Google Cloud. Si necesitas una cuota adicional de Cloud TPU, puedes solicitarla en la página Cuotas. Para obtener más información, consulta Solicita un límite de cuota mayor.
Cuando un servicio de Google Cloud aumenta los valores predeterminados de cuota para los recursos y las APIs, estos cambios se aplican de forma gradual. Esto podría provocar lanzamientos en curso en diferentes regiones o recursos. Durante el lanzamiento, el valor de la cuota que aparece en la consola de Google Cloud o en la API de Cloud Quotas no reflejará el nuevo valor de la cuota aumentado hasta que se complete el lanzamiento. Para obtener más información, consulta Visualiza los lanzamientos en curso.