Quotas
Ce document répertorie les quotas qui s'appliquent à Cloud TPU. Pour en savoir plus sur les tarifs de Cloud TPU, consultez la page Tarifs de Cloud TPU.
Un quota limite la quantité d'une ressource Google Cloud partagée particulière que votre projet Google Cloud peut utiliser, y compris les composants matériels, logiciels et réseau.
Les quotas font partie d'un système qui effectue les opérations suivantes :
- Surveille votre utilisation ou votre consommation des produits et services Google Cloud
- Limite la consommation de ces ressources pour des raisons telles que l'équité et la réduction des pics d'utilisation
- Gère des configurations qui appliquent automatiquement des restrictions recommandées
- Fournit un moyen de modifier le quota ou de demander des modifications
Dans la plupart des cas, lorsqu'un quota est dépassé, le système bloque immédiatement l'accès à la ressource Google concernée et la tâche que vous essayez d'effectuer échoue. Dans la plupart des cas, les quotas s'appliquent à chaque projet Google Cloud. Ils sont partagés entre toutes les applications et adresses IP qui utilisent ce projet.
Allocation de quotas
Le quota est attribué différemment en fonction de la version de TPU que vous utilisez. Pour les TPU v4 ou versions ultérieures, le quota est spécifié en termes de puces Cloud TPU ou de TensorCores. Tous les TPU v4 sont traités comme des tranches. Il n'existe donc pas de concept d'appareil TPU unique. Vous pouvez utiliser votre quota v4 dans n'importe quelle combinaison de segments. Par exemple, si vous disposez d'un quota pour une tranche v4-32, vous pouvez l'utiliser pour créer quatre tranches v4-8.
Pour les TPU v2 et v3, le quota est spécifié en termes de TensorCores. Un seul appareil Cloud TPU comprend quatre puces TPU et huit TensorCore, deux processeurs TensorCore par puce TPU. Les TPU v2 et v3 disposent de quotas distincts pour les appareils individuels et pour les pods TPU. Vous ne pouvez pas utiliser de quota de pods TPU v2 ou v3 pour les TPU v2-8 ou v3-8. Par exemple, si vous disposez d'un quota sur une tranche v3-32, vous ne pouvez pas l'utiliser pour créer quatre TPU v3-8.
Pour en savoir plus sur les puces TPU et TensorCores, consultez la section Architecture du système TPU.
Types de quotas
Il existe des quotas distincts pour les ressources Cloud TPU réservées, à la demande et préemptives. Le tableau suivant compare les caractéristiques de chaque type de quota.
Type de quota | Description | Valeur par défaut | Envoyer une demande | Indicateurs de création de TPU |
---|---|---|---|---|
Réservées | Quota de TPU réservés. Une réservation offre un haut niveau de garantie quant à l'obtention de la capacité Cloud TPU. Les instances réservées sont protégées contre les ruptures de stock, mais sont sujettes à des interruptions. Vous devez disposer d'une remise sur engagement d'utilisation pour accéder aux ressources réservées. | 0 | Pour demander une réservation, remplissez le formulaire d'inscription à Cloud TPU. |
Utilisez l'option
--reserved .
|
À la demande | Quota des TPU qui ne sont pas réservés et qui ne seront pas préemptés. Vous pouvez demander jusqu'à votre limite de quota de ressources Cloud TPU, mais la disponibilité des ressources n'est pas garantie. |
v3-8 et v2-8: 16 TensorCore Autres: 0 |
Consultez Demander un quota supplémentaire. | Aucun indicateur n'est requis, sélectionné par défaut. |
VM préemptive | Quota de TPU préemptifs. Le service Cloud TPU peut arrêter ces TPU à tout moment s'ils ont besoin de ressources supplémentaires pour les tâches dont la priorité est plus élevée. La disponibilité des ressources n'est pas garantie. Pour en savoir plus, consultez la section TPU préemptifs. |
v3-8 et v2-8: 48 TensorCores Autres: 0 |
Consultez Demander un quota supplémentaire. |
Utilisez l'option
--preemptible ou
--best-effort pour une requête de
ressource en file d'attente. |
Afficher et demander un quota supplémentaire
Vous pouvez afficher le quota attribué à votre projet Google Cloud sur la page Quotas de la console Google Cloud. Si vous avez besoin d'un quota supplémentaire de Cloud TPU, vous pouvez en faire la demande depuis la page "Quotas". Pour en savoir plus, consultez la section Demander un quota plus élevé.