Créer une VM qui utilise le modèle lié à la réservation

Ce document explique comment créer une instance de machine virtuelle (VM) autonome à l'aide du modèle de provisionnement lié à une réservation. Ce modèle de provisionnement vous permet de créer des VM A4X, A4 ou A3 Ultra en consommant une capacité pré-réservée.

Pour découvrir d'autres méthodes de création de VM à l'aide du modèle de provisionnement lié à la réservation, consultez Présentation des options de déploiement dans la documentation AI Hypercomputer.

Avant de commencer

  • Si ce n'est pas déjà fait, configurez l'authentification. L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    2. Set a default region and zone.

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Rôles requis

Pour obtenir les autorisations nécessaires à la création de VM à l'aide du modèle de provisionnement lié à une réservation, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour créer des VM à l'aide du modèle de provisionnement lié à une réservation. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour créer des VM à l'aide du modèle de provisionnement lié à une réservation :

  • compute.instances.create sur le projet
  • Pour créer la VM à l'aide d'une image personnalisée : compute.images.useReadOnly sur l'image
  • Pour créer la VM à l'aide d'un instantané : compute.snapshots.useReadOnly sur l'instantané
  • Pour créer la VM à l'aide d'un modèle d'instance : compute.instanceTemplates.useReadOnly sur le modèle d'instance
  • Pour spécifier un sous-réseau pour la VM : compute.subnetworks.use sur le projet ou sur le sous-réseau choisi
  • Pour spécifier une adresse IP statique pour la VM : compute.addresses.use sur le projet
  • Pour attribuer une adresse IP externe à la VM, en cas d'utilisation d'un réseau VPC : compute.subnetworks.useExternalIp sur le projet ou sur le sous-réseau choisi
  • Pour attribuer un ancien réseau à la VM : compute.networks.use sur le projet
  • Pour attribuer une adresse IP externe à la VM, en cas d'utilisation d'un ancien réseau : compute.networks.useExternalIp sur le projet
  • Pour définir les métadonnées d'instance de VM pour la VM : compute.instances.setMetadata sur le projet
  • Pour définir des tags pour la VM : compute.instances.setTags sur la VM
  • Pour définir des libellés pour la VM : compute.instances.setLabels sur la VM
  • Pour définir un compte de service à utiliser avec la VM : compute.instances.setServiceAccount sur la VM
  • Pour créer un disque pour la VM : compute.disks.create sur le projet
  • Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture : compute.disks.use sur le disque
  • Pour associer un disque existant en mode lecture seule : compute.disks.useReadOnly sur le disque

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Créer une VM qui utilise le modèle de provisionnement lié à une réservation

Pour créer une VM A4X, A4 ou A3 Ultra à l'aide du modèle de provisionnement lié à une réservation, vous devez attendre que la réservation automatique que vous souhaitez utiliser atteigne son heure de début. De plus, la VM que vous souhaitez créer doit répondre à toutes les exigences suivantes :

L'exemple suivant crée une requête de réservation future en mode calendrier pour cinq VM A3 Ultra, puis crée une VM A3 Ultra en consommant la réservation créée automatiquement pour la requête.

Pour créer une VM d'exemple à l'aide du modèle de provisionnement lié à la réservation, sélectionnez l'une des options suivantes :

Console

  1. Créez un exemple de demande pour cinq VM A3 Ultra et envoyez-le pour examen :

    1. Dans la console Google Cloud , accédez à la page Réservations.

      Accéder à la page "Réservations"

    2. Cliquez sur l'onglet Réservations futures.

    3. Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche.

    4. Dans la section Configuration matérielle, sélectionnez Spécifier un type de machine, puis spécifiez une instance A3 Ultra.

    5. Dans la section Méthode d'obtention, procédez comme suit :

      1. Sélectionnez Rechercher une capacité pour une durée maximale de 90 jours.

      2. Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

      3. Dans le champ Capacité totale nécessaire, saisissez 5.

      4. Dans la section Période de réservation, spécifiez la période de réservation.

    6. Renseignez les champs restants, puis cliquez sur Envoyer.

  2. À l'heure de début de la requête, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Créer une instance.

      Accéder à la page Créer une instance

    2. Dans le champ Nom, saisissez un nom pour la VM. Pour cet exemple, saisissez example-vm.

    3. Spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

    4. Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une VM A3 Ultra et définit le modèle de provisionnement sur Lié à une réservation.

    5. Dans le menu de navigation, cliquez sur Avancé.

    6. Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation.

    7. Dans le volet Choisir une réservation, procédez comme suit :

      1. Sélectionnez une réservation spécifique. Si vous souhaitez utiliser une réservation partagée qui existe dans un autre projet, sélectionnez le projet dans lequel la réservation existe dans la liste Projet.

      2. Cliquez sur Choisir.

    8. Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.

    9. Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (par défaut) ou Supprimer.

    10. Cliquez sur Créer.

gcloud

  1. Pour créer un exemple de demande pour cinq VM A3 Ultra et l'envoyer pour examen, utilisez la commande gcloud beta compute future-reservations create :

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la requête, le 5 octobre 2025, Compute Engine augmente le nombre de VM avec GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la requête, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, utilisez la commande gcloud compute instances create avec les options suivantes :

    • L'option --instance-termination-action

    • L'option --provisioning-model est définie sur RESERVATION_BOUND.

    • L'option --reservation

    • L'option --reservation-affinity est définie sur specific.

    La commande ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une VM A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    La commande inclut les valeurs suivantes :

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) la VM à la fin de la période de réservation.

    • RESERVATION_URL : URL de la réservation, au format suivant :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Pour créer un exemple de requête pour cinq VM A3 Ultra et l'envoyer pour examen, envoyez une requête POST à la méthode bêta futureReservations.insert :

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la requête, le 5 octobre 2025, Compute Engine augmente le nombre de VM avec GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la requête, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, envoyez une requête POST à la méthode instances.insert. Dans le corps de la requête, incluez les champs suivants :

    • Le champ reservationAffinity.consumeReservationType est défini sur SPECIFIC_RESERVATION.

    • Le champ reservationAffinity.key est défini sur compute.googleapis.com/reservation-name.

    • Le champ reservationAffinity.values défini sur l'URL de la réservation.

    • Le champ scheduling.instanceTerminationAction

    • Le champ scheduling.provisioningModel défini sur RESERVATION_BOUND.

    La requête ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une VM A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Le corps de la requête inclut les valeurs suivantes :

    • RESERVATION_URL : URL de la réservation, au format suivant :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) la VM à la fin de la période de réservation.

Étapes suivantes

Faites l'essai

Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits offerts pour exécuter, tester et déployer des charges de travail.

Profiter d'un essai gratuit de Compute Engine