À propos des requêtes de redimensionnement d'un MIG


Ce document décrit le fonctionnement des requêtes de redimensionnement dans un groupe d'instances géré (MIG), ainsi que les limites associées. Les requêtes de redimensionnement vous permettent de créer simultanément plusieurs instances de machines virtuelles (VM) avec des GPU dans un MIG.

La création simultanée de VM dans un MIG via une requête de redimensionnement est utile dans les scénarios suivants :

  • Lorsque vous souhaitez utiliser des VM GPU uniquement pendant une durée limitée, une requête de redimensionnement augmente les chances d'obtenir ces ressources très demandées.

  • Lorsque vous souhaitez qu'un nombre exact de VM exécutent un job, une requête de redimensionnement vous permet de créer des VM simultanément. Cela permet d'éviter des frais inutiles liés à la capacité partielle créée par Compute Engine en attendant que toutes les ressources soient disponibles.

Fonctionnement des requêtes de redimensionnement

Les sections suivantes décrivent le fonctionnement des requêtes de redimensionnement.

À la création

Lorsque vous créez une requête de redimensionnement, vous devez spécifier les propriétés suivantes:

  • resizeBy : nombre de VM que vous souhaitez créer simultanément dans le cadre de la requête.

  • requestedRunDuration : durée d'exécution des VM créées dans le cadre de la requête. La durée d'exécution doit être comprise entre 10 minutes et 7 jours. À la fin de la durée d'exécution, le MIG supprime automatiquement les VM créées.

Après la création

Une fois que vous avez créé une requête de redimensionnement, Compute Engine modifie son état comme suit:

  • CREATING: Compute Engine crée la requête de redimensionnement, la taille cible du MIG augmente en fonction du nombre de VM spécifiées dans la requête, et le MIG crée des instances gérées à l'état CREATING. Ces instances gérées représentent les VM que le MIG crée lorsque la requête de redimensionnement aboutit.

  • ACCEPTED: la requête a été créée et acceptée. Le mécanisme d'ordonnancement sous-jacent, le planificateur de charge de travail dynamique (DWS), planifie la création des ressources demandées en fonction de leur disponibilité et de la durée d'exécution spécifiée dans la demande. Si vous manquez de quota pour les ressources demandées ou si les ressources sont temporairement indisponibles, le DWS conserve la requête jusqu'à ce que vous ayez suffisamment de quota et que les ressources soient disponibles.

  • SUCCEEDED : le MIG a créé simultanément le nombre de VM demandé. Les VM s'exécutent jusqu'à ce que le MIG les supprime après la fin de la durée d'exécution spécifiée ou jusqu'à ce que vous supprimiez les VM.

  • FAILED : la requête de redimensionnement a échoué en raison d'une erreur technique, et Compute Engine a réduit la taille cible du MIG en fonction du nombre de VM demandées.

  • CANCELLED: un utilisateur a annulé la requête de redimensionnement. L'annulation d'une requête de redimensionnement empêche le MIG de créer les ressources demandées. Après avoir annulé une requête de redimensionnement, Compute Engine réduit la taille cible du MIG en fonction du nombre de VM demandées et supprime automatiquement la requête au bout de 14 jours. Vous pouvez éventuellement supprimer une requête de redimensionnement avant que Compute Engine ne la supprime automatiquement.

Si vous supprimez un MIG contenant des requêtes de redimensionnement, cette opération supprime également toutes les requêtes de redimensionnement et les VM du MIG. Toutefois, si vous supprimez un MIG lorsque celui-ci crée des VM pour répondre à une requête de redimensionnement, Compute Engine attend que le MIG ait terminé de créer le nombre de VM demandé et que l'état de la requête de redimensionnement passe à SUCCEEDED avant de supprimer le groupe d'instances géré.

Limites

Les sections suivantes décrivent les limites relatives à la création de requêtes de redimensionnement dans un MIG.

Pour les demandes de redimensionnement

Les limites suivantes s'appliquent aux requêtes de redimensionnement :

  • Vous pouvez utiliser une requête de redimensionnement pour obtenir des VM GPU uniquement.

  • Vous ne pouvez annuler que les requêtes de redimensionnement acceptées (ACCEPTED).

  • Vous ne pouvez supprimer une requête de redimensionnement qu'après sa réussite (SUCCEEDED), son échec (FAILED) ou son annulation par un utilisateur (CANCELLED).

Pour le modèle d'instance

Les limites suivantes s'appliquent au modèle d'instance utilisé dans le MIG dans lequel vous souhaitez créer des requêtes de redimensionnement :

Pour le MIG

Les limites suivantes s'appliquent au MIG dans lequel vous souhaitez créer des requêtes de redimensionnement :

Quota pour les VM avec GPU avec la durée d'exécution demandée

Les VM GPU configurées pour être automatiquement supprimées après une durée d'exécution prédéfinie de sept jours ou moins peuvent consommer des quotas d'allocation préemptibles ou standards. Ce comportement vise à vous aider à améliorer la disponibilité du quota d'allocation pour les charges de travail temporaires, mais non interrompues. Pour en savoir plus sur ce comportement, consultez la section VM GPU et quotas d'allocation préemptive.

Tarifs

La création, l'annulation ou la suppression de requêtes de redimensionnement n'entraîne aucuns frais. Vous ne payez que les VM créées via une requête de redimensionnement, du moment où le MIG crée les VM jusqu'à ce qu'il les supprime automatiquement à la fin de leur durée d'exécution ou que vous les supprimiez manuellement.

Si un MIG ne crée que certaines des VM demandées et ne parvient pas à créer les autres, des frais peuvent toujours vous être facturés pour les VM créées jusqu'à ce que le MIG les supprime automatiquement.

Étape suivante