Ce document décrit le fonctionnement des requêtes de redimensionnement dans un groupe d'instances géré (MIG), ainsi que les limites associées. Les requêtes de redimensionnement vous permettent de créer simultanément plusieurs instances de machines virtuelles (VM) avec des GPU dans un MIG.
La création simultanée de VM dans un MIG via une requête de redimensionnement est utile dans les scénarios suivants :
Lorsque vous souhaitez utiliser des VM GPU uniquement pendant une durée limitée, une requête de redimensionnement augmente les chances d'obtenir des GPU, qui sont des ressources très demandées.
Lorsque vous souhaitez qu'un nombre exact de VM exécutent un job, une requête de redimensionnement vous permet de créer des VM simultanément. En utilisant des requêtes de redimensionnement, vous pouvez également éviter des frais inutiles liés à la capacité partielle créée par Compute Engine en attendant que toutes les ressources soient disponibles.
Fonctionnement des requêtes de redimensionnement
Lors de la création d'une requête de redimensionnement, vous devez spécifier les éléments suivants :
resizeBy
: nombre de VM que vous souhaitez créer simultanément dans le cadre de la requête.requestedRunDuration
: durée d'exécution des VM créées dans le cadre de la requête. La durée d'exécution doit être comprise entre 10 minutes et 7 jours. À la fin de la durée d'exécution, le MIG supprime les VM créées.
Lorsque vous créez une requête de redimensionnement dans un MIG, Compute Engine définit l'état de la requête sur CREATING
, puis la fait passer à ACCEPTED
lors de la création de la requête. Le planificateur de charges de travail dynamique (DWS), mécanisme de planification sous-jacent, planifie les requêtes de redimensionnement créées dans Compute Engine en fonction des durées et de la disponibilité des ressources demandées.
Une fois que le service DWS a planifié la création du nombre de VM demandé, le MIG augmente sa taille cible en fonction du nombre de VM demandées et crée des instances gérées qui se trouvent dans un état CREATING
. Ces instances gérées représentent les VM que le MIG crée lorsque la requête de redimensionnement aboutit. Vous ne pouvez pas supprimer les instances gérées à l'état CREATING
, sauf si vous annulez la requête de redimensionnement.
Si vous manquez de quota pour les ressources demandées ou si les ressources sont temporairement indisponibles, le DWS conserve la requête jusqu'à ce que vous ayez suffisamment de quota et que les ressources soient disponibles.
Une requête de redimensionnement acceptée reste telle quelle jusqu'à ce que Compute Engine définisse son état sur l'un des suivants :
SUCCEEDED
: le MIG a créé simultanément le nombre de VM demandé. Les VM s'exécutent jusqu'à ce que le MIG les supprime après la fin de la durée d'exécution spécifiée ou jusqu'à ce que vous supprimiez les VM.FAILED
: la requête de redimensionnement a échoué en raison d'une erreur technique, et Compute Engine a réduit la taille cible du MIG en fonction du nombre de VM demandées.CANCELLED
: un utilisateur a annulé la requête de redimensionnement, et Compute Engine a réduit la taille cible du MIG en fonction du nombre de VM demandées. Si vous souhaitez empêcher une requête de redimensionnement acceptée de créer des VM, vous devez annuler la requête de redimensionnement. Vous pourrez éventuellement la supprimer par la suite. Si vous ne supprimez pas une requête de redimensionnement annulée, Compute Engine la supprime automatiquement 14 jours après son annulation.
Pour vérifier l'état d'une requête de redimensionnement acceptée ou résoudre les problèmes associés, affichez les détails de la requête de redimensionnement.
Si vous supprimez un MIG contenant des requêtes de redimensionnement, cette opération supprime également toutes les requêtes de redimensionnement et les VM du MIG. Toutefois, si vous supprimez un MIG lorsque celui-ci crée des VM pour répondre à une requête de redimensionnement, Compute Engine attend que le MIG ait terminé de créer le nombre de VM demandé et que l'état de la requête de redimensionnement passe à SUCCEEDED
avant de supprimer le groupe d'instances géré.
Limites
Les sections suivantes décrivent les limites relatives à la création de requêtes de redimensionnement dans un MIG.
Limites applicables aux requêtes de redimensionnement
Les limites suivantes s'appliquent aux requêtes de redimensionnement :
Vous pouvez utiliser une requête de redimensionnement pour obtenir des VM GPU uniquement.
Vous ne pouvez créer une requête de redimensionnement que dans les MIG zonaux.
Vous ne pouvez annuler que les requêtes de redimensionnement acceptées (
ACCEPTED
).Vous ne pouvez supprimer une requête de redimensionnement qu'après sa réussite (
SUCCEEDED
), son échec (FAILED
) ou son annulation par un utilisateur (CANCELLED
).
Limites du modèle d'instance
Les limites suivantes s'appliquent au modèle d'instance utilisé dans le MIG dans lequel vous souhaitez créer des requêtes de redimensionnement :
Vous devez spécifier l'arrêt des VM lors des événements de maintenance de l'hôte.
Vous devez spécifier de ne pas utiliser de réservations.
Vous ne pouvez pas spécifier de VM Spot.
Vous ne pouvez pas spécifier de stratégies d'emplacement.
Vous ne pouvez pas spécifier les champs
maxRunDuration
outerminationTime
.
Limites du MIG
Les limites suivantes s'appliquent au MIG dans lequel vous souhaitez créer des requêtes de redimensionnement :
Vous devez désactiver les réparations dans le MIG.
Vous devez supprimer la configuration de l'autoscaling.
Vous ne pouvez pas appliquer de mises à jour de configuration aux VM créées via des requêtes de redimensionnement. Pour empêcher les mises à jour automatiques, définissez le type de mise à jour opportuniste pour le MIG.
Vous ne pouvez pas appliquer la configuration applicable à toutes les instances aux VM créées via des requêtes de redimensionnement.
Vous ne pouvez pas définir de configurations par instance dans les VM créées via des requêtes de redimensionnement.
Vous ne pouvez définir le mode de pool de secours du MIG que sur
manual
(par défaut).Si un MIG contient des requêtes de redimensionnement acceptées, vous ne pouvez pas effectuer les opérations suivantes :
Vous ne pouvez pas ajouter de deuxième modèle d'instance pour lancer une mise à jour Canary dans le MIG.
Vous ne pouvez pas modifier la taille cible du MIG.
Vous ne pouvez pas supprimer les instances gérées à l'état
CREATING
créées par le MIG pour une requête de redimensionnement. Pour supprimer ces instances gérées, vous devez annuler la requête de redimensionnement.Vous ne pouvez pas recréer, suspendre ou arrêter une VM créée via une requête de redimensionnement.
Quota pour les VM GPU avec la durée d'exécution demandée
Les VM GPU configurées pour être automatiquement supprimées après une durée d'exécution prédéfinie de sept jours ou moins peuvent consommer des quotas d'allocation préemptibles ou standards. Ce comportement vise à vous aider à améliorer la disponibilité du quota d'allocation pour les charges de travail temporaires, mais non interrompues. Pour en savoir plus sur ce comportement, consultez la section VM GPU et quotas d'allocation préemptive.Tarifs
La création, l'annulation ou la suppression de requêtes de redimensionnement n'engendre aucuns frais. Vous ne payez que les VM créées via une requête de redimensionnement, du moment où le MIG crée les VM jusqu'à ce qu'il les supprime automatiquement à la fin de leur durée d'exécution ou que vous les supprimiez manuellement.
Si un MIG ne crée qu'une partie des VM demandées et ne parvient pas à créer les VM restantes, des frais peuvent vous être facturés pour les VM créées jusqu'à ce que le MIG les supprime automatiquement.
Étape suivante
Découvrez comment créer des requêtes de redimensionnement dans un MIG.
Découvrez comment afficher, annuler ou supprimer des requêtes de redimensionnement dans un MIG.