Cette page a été traduite par l'API Cloud Translation.

Quotas Cloud TPU

Ce document liste les quotas qui s'appliquent à Cloud TPU. Pour en savoir plus sur les tarifs de Cloud TPU, consultez la section Tarifs de Cloud TPU.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre Google Cloud projet peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres Google Cloud ressources.

Le système Cloud Quotas effectue les opérations suivantes :

Surveille votre consommation de Google Cloud produits et services
Limite votre consommation de ces ressources
Permet de demander des modifications de la valeur du quota

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.

Quota de TPU

Les quotas varient selon la version de TPU. Par exemple, il existe différents quotas pour les TPU v2, v3, etc. Pour chaque version de TPU, il existe différents types de quotas: à la demande et préemptifs (VM Spot). Le tableau suivant décrit les différents types de quotas.

Type de quota	Description	Valeur par défaut	Comment faire une demande	Options pour la création de TPU
À la demande	Nombre de ressources à la demande auxquelles vous avez accès. Les ressources à la demande ne seront pas préemptées, mais le quota à la demande ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre demande.	v3-8 et v2-8: 16 TensorCores Tous les autres: 0	Consultez Demander un quota supplémentaire.	Aucune option n'est nécessaire. L'option est sélectionnée par défaut.
Préemptif	Nombre de ressources Cloud TPU préemptibles auxquelles vous avez accès. Ce quota s'applique aux TPU préemptifs et aux VM TPU Spot. Les ressources préemptibles peuvent être préemptées pour libérer de l'espace pour des tâches de priorité plus élevée. Le quota préemptif ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre demande. Pour en savoir plus, consultez les pages TPU préemptifs et Gérer des VM Spot TPU.	v3-8 et v2-8: 48 TensorCores Tous les autres: 0	Consultez Demander un quota supplémentaire.	VM Spot: utilisez l'option `--spot`. TPU préemptifs: utilisez l'option `--preemptible`. L'indicateur `--preemptible` n'est pas compatible avec les ressources mises en file d'attente. Utilisez plutôt l'option `--spot`.

Les quotas TPU sont spécifiés en termes de cœurs TPU par projet et par zone ou de cœurs TPU par projet et par région.

Quotas TPU v5p

Vous pouvez utiliser votre quota de TPU v5p dans n'importe quelle combinaison de cœurs. Par exemple, si vous disposez d'un quota de 32 cœurs, vous pouvez l'utiliser pour créer quatre tranches TPU, chacune avec huit cœurs.

Quotas préemptifs:

Cœurs TPU v5p préemptifs par projet et par région
Cœurs TPU v5p préemptifs par projet et par zone

Quotas à la demande:

Cœurs TPU v5p par projet et par région
Cœurs TPU v5p par projet et par zone

Quotas TPU v5e

Les TPU v5e peuvent être utilisés pour l'entraînement et la diffusion. Il existe des quotas distincts pour l'entraînement et le traitement, ainsi que pour les hôtes uniques (noyaux légers) et les hôtes multiples (noyaux de pod légers).

Quotas de diffusion

Quotas de diffusion préemptifs:

Cœurs de pod TPU v5 Lite préemptifs pour la diffusion par projet et par région
Cœurs de pod TPU v5 lite préemptifs pour la diffusion par projet et par zone

Quotas de diffusion à la demande:

Cœurs de pod TPU v5 Lite pour la diffusion par projet et par région
Cœurs de pod TPU v5 Lite pour la diffusion par projet et par zone

Quotas de formation

Quotas d'entraînement préemptifs:

Cœurs TPU v5 Lite préemptifs par projet et par région
Cœurs TPU v5 Lite préemptifs par projet et par zone
Cœurs de pod TPU v5 Lite préemptifs par projet et par région
Cœurs de pod TPU v5 Lite préemptifs par projet et par zone

Quotas de formation à la demande:

Cœurs TPU v5 Lite par projet et par région
Cœurs TPU v5 Lite par projet et par zone
Cœurs de pod TPU v5 Lite par projet et par région
Cœurs de pod TPU v5 Lite par projet et par zone

Quotas TPU v4

Vous pouvez utiliser votre quota TPU v4 dans n'importe quelle combinaison de cœurs. Par exemple, si vous disposez d'un quota de 32 cœurs, vous pouvez l'utiliser pour créer quatre tranches TPU, chacune avec huit cœurs.

Quotas préemptifs:

Cœurs de pod TPU v4 préemptifs par projet et par région
Cœurs de pod TPU v4 préemptifs par projet et par zone

Quotas à la demande:

Cœurs de pod TPU v4 par projet et par région
Cœurs de pod TPU v4 par projet et par zone

Quotas TPU v3

Il existe des quotas TPU v3 distincts pour les TPU à hôte unique (cœur) et les TPU à multi-hôte (pod). Vous devez utiliser des quotas de pod v3 pour créer des TPU avec plus de huit cœurs.

Quotas préemptifs:

Cœurs TPU v3 préemptifs par projet et par région
Cœurs TPU v3 préemptifs par projet et par zone
Cœurs de pod TPU v3 préemptifs par projet et par région
Cœurs de pod TPU v3 préemptifs par projet et par zone

Quotas à la demande:

Cœurs TPU v3 par projet et par région
Cœurs TPU v3 par projet et par zone
Cœurs de pods TPU v3 par projet et par région
Cœurs de pod TPU v3 par projet et par zone

Quotas TPU v2

Il existe des quotas TPU v2 distincts pour les TPU à hôte unique (cœur) et les TPU à multi-hôte (pod).

Quotas préemptifs:

Cœurs TPU v2 préemptifs par projet et par région
Cœurs TPU v2 préemptifs par projet et par zone
Cœurs de pod TPU v2 préemptifs par projet et par région
Cœurs de pod TPU v2 préemptifs par projet et par zone

Quotas à la demande:

Cœurs TPU v2 par projet et par région
Cœurs TPU v2 par projet et par zone
Cœurs de pods TPU v2 par projet et par région
Cœurs de pod TPU v2 par projet et par zone

Pour en savoir plus sur les puces TPU et les TensorCores, consultez la section Architecture du système TPU.

Afficher et demander un quota supplémentaire

Vous pouvez consulter le quota alloué à votre Google Cloud projet sur la page Quotas de la console Google Cloud. Si vous avez besoin d'un quota Cloud TPU supplémentaire, vous pouvez le demander sur la page "Quotas". Pour en savoir plus, consultez la section Demander une limite de quota supérieure.

Lorsqu'un service Google Cloud augmente les valeurs de quota par défaut pour les ressources et les API, ces modifications s'appliquent progressivement. Cela peut entraîner des déploiements continus dans différentes régions ou ressources. Lors du déploiement, la valeur de quota qui s'affiche dans la console Google Cloud ou l'API Cloud Quotas ne reflète pas la nouvelle valeur de quota augmentée tant que le déploiement n'est pas terminé. Pour en savoir plus, consultez la section Afficher les déploiements en cours.