Quotas Cloud TPU

Ce document répertorie les quotas qui s'appliquent à Cloud TPU. Pour en savoir plus sur les tarifs de Cloud TPU, consultez la page Tarifs de Cloud TPU.

Un quota limite la quantité d'une ressource Google Cloud partagée particulière que votre projet Google Cloud peut utiliser, y compris les composants matériels, logiciels et réseau. Par conséquent, les quotas font partie d'un système qui effectue les opérations suivantes :

  • Surveille votre utilisation ou votre consommation des produits et services Google Cloud
  • Limite la consommation de ces ressources pour des raisons telles que l'équité et la réduction des pics d'utilisation.
  • Gère des configurations qui appliquent automatiquement des restrictions recommandées.
  • Fournit un moyen de demander ou d'effectuer des modifications de quota.

Dans la plupart des cas, lorsqu'un quota est dépassé, le système bloque immédiatement l'accès à la ressource Google concernée et la tâche que vous essayez d'effectuer échoue. Dans la plupart des cas, les quotas s'appliquent à chaque projet Google Cloud. Ils sont partagés entre toutes les applications et adresses IP qui utilisent ce projet.

Quota de TPU

Les quotas sont différents pour chaque version de TPU. Par exemple, il existe des quotas différents pour les TPU v2, v3, etc. Pour chaque version de TPU, il existe différents types de quotas: réservés, à la demande, préemptifs (Spot). Le tableau suivant décrit les différents types de quotas.

Type de quota Description Valeur par défaut Procédure de demande Indicateurs pour la création de TPU
Réservées Nombre de ressources Cloud TPU pour lesquelles vous disposez d'un accès garanti. Vous devez disposer d'un accord de réservation pour accéder aux ressources réservées. Les ressources réservées sont protégées contre les ruptures de stock, mais peuvent faire l'objet d'interruptions. 0 Pour demander un quota réservé, contactez votre responsable de compte Google Cloud. Utilisez l'option --reserved.
À la demande Nombre de ressources à la demande auxquelles vous avez accès. Les ressources à la demande ne seront pas préemptées, mais le quota à la demande ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre requête. v3-8 et v2-8: 16 TensorCores
Tous les autres: 0
Consultez la section Demander une augmentation de quota. Aucun indicateur nécessaire, sélectionné par défaut.
VM préemptive Nombre de ressources Cloud TPU préemptives auxquelles vous avez accès. Ce quota s'applique aux TPU préemptifs et aux VM TPU Spot. Les ressources préemptives peuvent être préemptées pour faire de la place aux tâches prioritaires. Le quota préemptif ne garantit pas que suffisamment de ressources Cloud TPU seront disponibles pour répondre à votre requête. Pour en savoir plus, consultez les pages TPU préemptifs et Gérer les VM TPU Spot. v3-8 et v2-8: 48 TensorCores
Tous les autres: 0
Consultez la section Demander une augmentation de quota.

Les quotas de TPU sont spécifiés en termes de cœurs de TPU par projet et par zone, ou de cœurs de TPU par projet et par région.

Quotas de TPU v5p

Vous pouvez utiliser votre quota de TPU v5p avec n'importe quelle combinaison de cœurs. Par exemple, si votre quota est de 32 cœurs, vous pouvez utiliser ce quota pour créer quatre tranches de TPU comportant chacune 8 cœurs.

Quotas réservés:

  • Cœurs de TPU v5p réservés par projet et par région
  • Cœurs de TPU v5p réservés par projet et par zone

Quotas préemptifs:

  • Cœurs TPU v5p préemptifs par projet et par région
  • Cœurs de TPU v5p préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs de TPU v5p par projet et par région
  • Cœurs de TPU v5p par projet et par zone

Quotas de TPU v5e

TPU v5e peut être utilisé pour l'entraînement et l'inférence. Il existe des quotas distincts pour l'entraînement et la diffusion, ainsi que pour les cœurs à hôte unique (cœurs allégés) et multi-hôtes (cœurs de pod allégés).

Quotas de diffusion

Quotas de diffusion réservés:

  • Cœurs de pod TPU v5 Lite réservés pour la diffusion par projet et par région
  • Cœurs de pod TPU v5 Lite réservés pour la diffusion par projet et par zone

Quotas de diffusion préemptive:

  • Cœurs de pod TPU v5 préemptifs Lite pour la diffusion par projet et par région
  • Cœurs de pod TPU v5 préemptifs Lite pour la diffusion par projet et par zone

Quotas de diffusion à la demande:

  • Cœurs de pod TPU v5 pour la diffusion par projet et par région
  • Cœurs de pod TPU v5 pour la diffusion par projet et par zone

Quotas d'entraînement

Quotas d'entraînement réservés:

  • Cœurs TPU v5 Lite réservés par projet et par région
  • Cœurs TPU v5 Lite réservés par projet et par zone
  • Cœurs de pod TPU v5 Lite réservés par projet et par région
  • Cœurs de pod TPU v5 Lite réservés par projet et par zone

Quotas d'entraînement préemptif:

  • Cœurs TPU v5 Lite préemptifs par projet et par région
  • Cœurs TPU v5 Lite préemptifs par projet et par zone
  • Cœurs de pod TPU v5 préemptifs Lite par projet et par région
  • Cœurs de pod TPU v5 préemptifs Lite par projet et par zone

Quotas pour l'entraînement à la demande:

  • Cœurs TPU v5 Lite par projet et par région
  • Cœurs TPU v5 Lite par projet et par zone
  • Cœurs de pod TPU v5 par projet et par région
  • Cœurs de pod TPU v5 Lite par projet et par zone

Quotas de TPU v4

Vous pouvez utiliser votre quota de TPU v4 avec n'importe quelle combinaison de cœurs. Par exemple, si votre quota est de 32 cœurs, vous pouvez utiliser ce quota pour créer quatre tranches de TPU comportant chacune 8 cœurs.

Quotas réservés:

  • Cœurs de pod TPU v4 réservés par projet et par région
  • Cœurs de pod TPU v4 réservés par projet et par zone

Quotas préemptifs:

  • Cœurs de pod TPU v4 préemptifs par projet et par région
  • Cœurs de pod TPU v4 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs de pod TPU v4 par projet et par région
  • Cœurs de pod TPU v4 par projet et par zone

Quotas de TPU v3

Il existe des quotas TPU v3 distincts pour les TPU à hôte unique (cœur) et les TPU à hôtes multiples (pod). Vous devez utiliser les quotas de pods v3 pour créer des TPU de plus de huit cœurs.

Quotas réservés:

  • Cœurs TPU v3 réservés par projet et par région
  • Cœurs TPU v3 réservés par projet et par zone
  • Cœurs de pod TPU v3 réservés par projet et par région
  • Cœurs de pod TPU v3 réservés par projet et par zone

Quotas préemptifs:

  • Cœurs TPU v3 préemptifs par projet et par région
  • Cœurs TPU v3 préemptifs par projet et par zone
  • Cœurs de pod TPU v3 préemptifs par projet et par région
  • Cœurs de pod TPU v3 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs TPU v3 par projet et par région
  • Cœurs TPU v3 par projet et par zone
  • Cœurs de pod TPU v3 par projet et par région
  • Cœurs de pod TPU v3 par projet et par zone

Quotas de TPU v2

Il existe des quotas TPU v2 distincts pour les TPU à hôte unique (cœur) et les TPU multi-hôtes (pod).

Quotas réservés:

  • Cœurs TPU v2 réservés par projet et par région
  • Cœurs TPU v2 réservés par projet et par zone
  • Cœurs de pod TPU v2 réservés par projet et par région
  • Cœurs de pod TPU v2 réservés par projet et par zone

Quotas préemptifs:

  • Cœurs TPU v2 préemptifs par projet et par région
  • Cœurs TPU v2 préemptifs par projet et par zone
  • Cœurs de pod TPU v2 préemptifs par projet et par région
  • Cœurs de pod TPU v2 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs TPU v2 par projet et par région
  • Cœurs TPU v2 par projet et par zone
  • Cœurs de pod TPU v2 par projet et par région
  • Cœurs de pod TPU v2 par projet et par zone

Pour en savoir plus sur les puces TPU et les TensorCores, consultez la page Architecture du système TPU.

Afficher et demander un quota supplémentaire

Vous pouvez consulter le quota alloué pour votre projet Google Cloud sur la page Quotas de la console Google Cloud. Si vous avez besoin d'un quota Cloud TPU supplémentaire, vous pouvez en faire la demande sur la page "Quotas". Pour en savoir plus, consultez Demander une limite de quota plus élevée.