Modèles de provisionnement d'instances Compute Engine


Ce document décrit les modèles de provisionnement pour les instances Compute Engine. Pour en savoir plus sur les options de déploiement, consultez Choisir une stratégie de déploiement Compute Engine pour votre charge de travail.

Les modèles de provisionnement déterminent la disponibilité, la durée de vie et le prix de vos instances. Si vous comprenez ces modèles, vous pouvez choisir la meilleure option pour votre charge de travail.

Modèles de provisionnement disponibles

Lorsque vous créez une instance de calcul, vous pouvez spécifier l'un des modèles d'approvisionnement suivants. Si vous ne spécifiez pas de modèle d'approvisionnement, Compute Engine utilise le modèle d'approvisionnement standard par défaut.

  • Standard

  • Spot

  • Démarrage flexible (aperçu)

  • Liée à la réservation

Le tableau suivant vous aide à comparer les cas d'utilisation et les tarifs de chaque modèle de provisionnement :

Standard Spot Démarrage flexible (aperçu) Liée à la réservation
Résumé
  • En fonction de la disponibilité des ressources, vous pouvez créer des instances immédiatement.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances.
  • En fonction de la disponibilité des ressources, vous pouvez créer des instances immédiatement.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances. Toutefois, vous autorisez également Compute Engine à arrêter ou supprimer des instances à tout moment pour récupérer de la capacité.
  • Une fois que vous avez créé un groupe d'instances géré (MIG) zonal, vous demandez à Compute Engine d'ajouter des instances avec des GPU associés au MIG. Compute Engine planifie le provisionnement des instances en fonction de la disponibilité des ressources.
  • Vous pouvez choisir quand supprimer les instances. Toutefois, vous ne pouvez pas les arrêter, les suspendre ni les recréer. Les instances s'exécutent pendant sept jours maximum. Compute Engine les supprime ensuite.
  • Vous pouvez demander à réserver de la capacité à une date ultérieure pour créer des instances avec des GPU associés. Si Google Cloud approuve votre demande, Compute Engine crée une réservation. Au début de la période de réservation, vous pouvez utiliser la réservation en créant des instances de GPU qui correspondent à la réservation.
  • Pendant la période de réservation approuvée, vous pouvez arrêter, redémarrer, supprimer et recréer des instances pour consommer la réservation selon vos besoins. À la fin de la période de réservation, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui la consomment.
Cas d'utilisation

Idéal pour les charges de travail qui nécessitent de la stabilité et un fonctionnement continu, telles que les suivantes :

  • Serveurs Web
  • Bases de données
  • Applications d'entreprise
  • Développement et tests

Idéal pour les charges de travail qui peuvent tolérer des interruptions, telles que les suivantes :

  • Traitement par lot
  • Calcul hautes performances (HPC)
  • Intégration continue et déploiement continu (CI/CD)
  • Analyse de données
  • Encodage multimédia
  • Inférence en ligne

Charges de travail nécessitant de la stabilité et devant s'exécuter pendant sept jours maximum, comme les suivantes :

  • Pré-entraînement de petits modèles
  • Affinage de modèles
  • Simulation HPC
  • Inférence par lot

Idéal pour les charges de travail nécessitant de la stabilité et une durée d'exécution spécifique, comme les suivantes :

  • Pour les charges de travail qui durent jusqu'à 90 jours :

    • Jobs de pré-entraînement de modèle
    • Jobs d'affinage de modèles
    • Charges de travail de simulation HPC
    • Augmentations attendues à court terme des charges de travail d'inférence
  • Pour les charges de travail de plus de 90 jours :

    • Charges de travail d'entraînement
    • Charges de travail d'inférence
Tarifs Les instances vous sont facturées au tarif standard. Pour en savoir plus, consultez la page Tarifs des instances de VM. La plupart des processeurs virtuels, GPU et disques SSD locaux sont disponibles avec une remise de 60 à 91 %. Pour en savoir plus, consultez Tarifs des VM Spot. En fonction de la famille de machines utilisée par vos instances, vous bénéficiez d'une remise allant jusqu'à 53 % sur les processeurs virtuels et les GPU. Consultez la page Tarifs du planificateur de charges de travail dynamique.

En fonction de la famille de machines utilisée par vos instances, vous bénéficiez d'une remise allant jusqu'à 53 % sur les processeurs virtuels et les GPU. De plus, des frais vous sont facturés en fonction de la façon dont vous réservez de la capacité pour créer des instances, comme suit :

Quota Lorsque vous créez une instance, le quota standard est utilisé. Lorsque vous créez une instance, le quota d'instances préemptives est utilisé. Si votre projet ne dispose pas de quota préemptif, le quota standard est utilisé. Les crédits de la version gratuite ne s'appliquent pas aux VM Spot.Google Cloud Lorsque le MIG ajoute des instances au groupe, le quota d'instances préemptives est consommé. Si votre projet ne dispose pas de quota préemptif, le quota standard est utilisé. Le quota ne s'applique pas au modèle de provisionnement lié aux réservations.

Disponibilité et durée de vie des instances

Le tableau suivant indique la disponibilité et la durée de vie des instances de calcul pour chaque modèle de provisionnement :

Standard Spot Démarrage flexible (aperçu) Liée à la réservation
Conditions préalables à la création Aucun prérequis pour la création. Aucun prérequis pour la création. Aucun prérequis pour la création.

Pour créer des instances, vous devez d'abord réserver de la capacité à l'aide de l'une des méthodes suivantes :

À la date et à l'heure de livraison choisies, Compute Engine provisionne la capacité demandée. Vous pouvez ensuite utiliser la capacité en créant des instances.

Série de machines compatible Vous pouvez utiliser n'importe quelle série de machines, à l'exception des séries A4X, A4 et A3 Ultra. Vous pouvez utiliser n'importe quelle série de machines, à l'exception des instances A4X, G4, X4 et Bare Metal.

Vous ne pouvez utiliser que les séries de machines suivantes :

Selon la façon dont vous réservez de la capacité pour créer des VM, vous ne pouvez utiliser que les séries de machines suivantes :

Disponibilité des instances Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles. Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles. Vous ne pouvez créer des instances qu'en créant des requêtes de redimensionnement dans un MIG. Compute Engine utilise DWS pour planifier le provisionnement de la capacité demandée en fonction de la disponibilité des ressources. DWS vous aide à obtenir des ressources très demandées, comme des GPU. Vous ne pouvez créer des instances qu'après avoir réservé de la capacité pour une date ultérieure. À la date demandée, Compute Engine fournit la capacité demandée, que vous pouvez ensuite utiliser pour créer des instances. Si vous réservez des ressources à l'aide de réservations futures en mode calendrier, Compute Engine utilise DWS pour provisionner la capacité demandée. DWS vous aide à obtenir des ressources très demandées, comme des GPU.
Garantie de capacité En fonction de la méthode de création. L'assurance de capacité varie en fonction de la méthode que vous utilisez pour créer des instances :
  • Si vous créez immédiatement des instances, Compute Engine s'efforce de provisionner la capacité demandée.
  • Si vous créez des instances en consommant une réservation à la demande ou une réservation créée automatiquement pour une réservation future, vous avez une très grande assurance que Compute Engine provisionne la capacité demandée si la réservation dispose de capacité réservée disponible.
Provisionnement optimal : Lorsque vous créez des Spot VM, Compute Engine fait de son mieux pour provisionner la capacité demandée. Provisionnement optimal : Lorsque vous créez une demande de redimensionnement de MIG, Compute Engine s'efforce de planifier le provisionnement de la capacité demandée. Très élevé : Si Google Cloud approuve votre demande de réservation, vous avez la quasi-certitude que Compute Engine provisionnera votre capacité réservée à la date et à l'heure de livraison de votre choix. Vous avez un accès exclusif à votre capacité réservée pendant la période de réservation.
Durée de vie de l'instance

Vous pouvez contrôler quand arrêter ou supprimer une instance, sauf dans les cas suivants :

  • Si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête vos instances lors des événements de maintenance de l'hôte.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.

Vous pouvez contrôler quand arrêter ou supprimer une instance, sauf dans les cas suivants :

  • Compute Engine peut arrêter ou supprimer l'instance à tout moment pour récupérer de la capacité. Ce processus est appelé préemption.
  • Si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête vos instances lors des événements de maintenance de l'hôte.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.

Les instances provisionnées s'exécutent pendant la durée de votre choix, qui peut aller jusqu'à sept jours. Vous ne pouvez pas arrêter, suspendre ni recréer des instances.

Compute Engine supprime les instances dans les cas suivants :

  • Vous demandez à supprimer des instances.
  • Les instances atteignent la fin de leur durée d'exécution.

Vous pouvez contrôler quand arrêter ou supprimer une instance, sauf dans les cas suivants :

  • Compute Engine arrête votre instance lors des événements de maintenance de l'hôte.
  • La réservation créée automatiquement pour provisionner la capacité demandée arrive à la fin de sa période de réservation engagée. À ce moment-là, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui l'utilisent.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.

Étapes suivantes