Ce document explique comment créer des instances avec des GPU associés à partir des séries de machines A3 Ultra ou A4. Pour en savoir plus sur la création d'instances avec des GPU associés, consultez Présentation de la création d'une instance avec des GPU associés.
Avant de commencer
- Pour connaître les limites et les étapes préalables supplémentaires à la création d'une instance avec des GPU associés, comme la sélection d'une image d'OS ou la vérification du quota de GPU, consultez Présentation de la création d'une instance avec des GPU associés.
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification est le processus permettant de valider votre identité pour accéder aux services et aux API Google Cloud .
Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installez Google Cloud CLI. Après l'installation, initialisez Google Cloud CLI en exécutant la commande suivante :
gcloud init
Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
- Set a default region and zone.
REST
Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.
Installez Google Cloud CLI. Après l'installation, initialisez Google Cloud CLI en exécutant la commande suivante :
gcloud init
Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires à la création d'instances, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (
roles/compute.instanceAdmin.v1
) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Ce rôle prédéfini contient les autorisations requises pour créer des instances. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer des instances :
compute.instances.create
sur le projet-
Pour créer la VM à l'aide d'une image personnalisée :
compute.images.useReadOnly
sur l'image -
Pour créer la VM à l'aide d'un instantané :
compute.snapshots.useReadOnly
sur l'instantané -
Pour créer la VM à l'aide d'un modèle d'instance :
compute.instanceTemplates.useReadOnly
sur le modèle d'instance -
Pour attribuer un ancien réseau à la VM :
compute.networks.use
sur le projet -
Pour spécifier une adresse IP statique pour la VM :
compute.addresses.use
sur le projet -
Pour attribuer une adresse IP externe à la VM, en cas d'utilisation d'un ancien réseau :
compute.networks.useExternalIp
sur le projet -
Pour spécifier un sous-réseau pour la VM :
compute.subnetworks.use
sur le projet ou sur le sous-réseau choisi -
Pour attribuer une adresse IP externe à la VM, en cas d'utilisation d'un réseau VPC :
compute.subnetworks.useExternalIp
sur le projet ou sur le sous-réseau choisi -
Pour définir les métadonnées d'instance de VM pour la VM :
compute.instances.setMetadata
sur le projet -
Pour définir des tags pour la VM :
compute.instances.setTags
sur la VM -
Pour définir des libellés pour la VM :
compute.instances.setLabels
sur la VM -
Pour définir un compte de service à utiliser avec la VM :
compute.instances.setServiceAccount
sur la VM -
Pour créer un disque pour la VM :
compute.disks.create
sur le projet -
Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture :
compute.disks.use
sur le disque -
Pour associer un disque existant en mode lecture seule :
compute.disks.useReadOnly
sur le disque
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Déterminer comment créer des instances A3 Ultra ou A4
Les instances A3 Ultra ou A4 sont disponibles via les options de création suivantes, qui ont chacune des procédures de création, une disponibilité des ressources et des tarifs différents. Identifiez l'option que vous souhaitez utiliser en fonction de votre charge de travail.
Si vous devez exécuter des charges de travail d'IA et de ML de longue durée, telles que l'entraînement et l'inférence de grands modèles, qui nécessitent la latence la plus faible, créez des VM ou des clusters qui utilisent les fonctionnalités et les services disponibles dans Cluster Director. Avec Cluster Director, vous pouvez réserver des machines à allocation dense qui fournissent une planification tenant compte de la topologie, ainsi qu'une surveillance et une maintenance améliorées. Pour en savoir plus sur Cluster Director, consultez Cluster Director dans la documentation AI Hypercomputer.
Pour savoir comment créer des instances A3 Ultra ou A4, consultez Présentation de la création de VM et de clusters dans la documentation AI Hypercomputer.
Si vous avez besoin de charges de travail d'IA et de ML de plus courte durée, choisissez l'une des options suivantes :
Si vos charges de travail doivent s'exécuter pendant 90 jours maximum avec une latence réseau minimale, réservez des machines à allocation dense pour une date ultérieure à l'aide des requêtes de réservation future en mode calendrier. Au début de votre période de réservation, vous pouvez créer des instances A3 Ultra ou A4 en utilisant la capacité réservée. À la fin de la période de réservation, Compute Engine supprime la réservation et toutes les VM qui l'utilisent.
Pour savoir comment créer des instances A3 Ultra ou A4 qui utilisent une réservation, consultez Créer une instance A3 Ultra ou A4 dans ce document.
Si vos charges de travail peuvent démarrer à tout moment et nécessitent un nombre exact de VM pour démarrer, utilisez des requêtes de redimensionnement dans un groupe d'instances géré (MIG). Les demandes de redimensionnement de MIG vous permettent de demander à Compute Engine d'ajouter des VM à votre MIG en une seule fois, chaque fois que des ressources sont disponibles. Ces VM peuvent s'exécuter pendant sept jours maximum. Étant donné que les ressources sont fournies à partir d'un pool sécurisé, vous avez plus de chances d'obtenir des GPU que si vous faisiez une demande à la demande.
Pour en savoir plus sur les requêtes de redimensionnement de MIG, consultez À propos des requêtes de redimensionnement dans un MIG.
Si vos charges de travail tolèrent les interruptions de disponibilité, vous pouvez bénéficier de remises importantes en utilisant des VM Spot. Vous pouvez créer et supprimer des VM Spot selon vos besoins. Toutefois, les VM Spot sont des ressources finies. Compute Engine peut donc les préempter (c'est-à-dire les arrêter ou les supprimer automatiquement) à tout moment pour récupérer de la capacité. Pour en savoir plus sur les VM Spot, consultez VM Spot.
Pour savoir comment créer des instances A3 Ultra ou A4 à l'aide de VM Spot, consultez Créer une instance A3 Ultra ou A4 dans ce document.
Créer une instance A3 Ultra ou A4
Pour créer une instance A3 Ultra ou A4 à l'aide d'une réservation ou de VM Spot, procédez comme suit :
Créer des réseaux VPC
Pour le type de machine A4 ou A3 Ultra, vous devez créer trois réseaux VPC pour les interfaces réseau suivantes :
- Deux réseaux VPC pour les interfaces réseau gVNIC. Elles sont utilisées pour la communication d'hôte à hôte.
- Un réseau VPC avec le profil réseau RDMA est requis pour les cartes d'interface réseau CX7. Ce réseau doit comporter huit sous-réseaux, un pour chaque carte d'interface réseau CX7, et est utilisé pour la communication entre les GPU.
Pour en savoir plus sur la configuration des cartes d'interface réseau, consultez Examiner la bande passante réseau et la configuration des cartes d'interface réseau.
Configurez les réseaux manuellement en suivant les guides d'instructions ou automatiquement à l'aide du script fourni.
Guides d'instructions
Pour créer les réseaux, vous pouvez suivre les instructions suivantes :
- Pour créer les réseaux VPC pour les gVNIC, consultez Créer et gérer des réseaux de cloud privé virtuel.
- Pour créer le réseau VPC avec le profil réseau RDMA, consultez Créer un réseau de cloud privé virtuel pour les cartes d'interface réseau RDMA.
Pour ces réseaux VPC, nous vous recommandons de définir l'unité de transmission maximale (MTU) sur une valeur plus élevée. Pour les types de machines A4 ou A3 Ultra, la MTU recommandée est de
8896
octets. Pour connaître les paramètres MTU recommandés pour les autres types de machines GPU, consultez Paramètres MTU pour les types de machines GPU.Script
Pour créer les réseaux, procédez comme suit :
- Utilisez ce script pour créer le réseau.
Pour ces réseaux VPC, nous vous recommandons de définir l'unité de transmission maximale (MTU) sur une valeur plus élevée. Pour les types de machines A4 ou A3 Ultra, la MTU recommandée est de
8896
octets. Pour connaître les paramètres MTU recommandés pour les autres types de machines GPU, consultez Paramètres MTU pour les types de machines GPU.#!/bin/bash # Create standard VPCs (network and subnets) for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs done
Remplacez les éléments suivants :
GVNIC_NAME_PREFIX
: préfixe de nom personnalisé à utiliser pour les réseaux et sous-réseaux VPC standards des cartes NIC virtuelles Google.RDMA_NAME_PREFIX
: préfixe de nom personnalisé à utiliser pour le réseau VPC et les sous-réseaux avec le profil réseau RDMA pour les cartes d'interface réseau CX7.ZONE
: spécifiez une zone dans laquelle le type de machine que vous souhaitez utiliser est disponible, par exempleus-central1-a
. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.REGION
: région dans laquelle vous souhaitez créer les sous-réseaux. Cette région doit correspondre à la zone spécifiée. Par exemple, si votre zone estus-central1-a
, votre région estus-central1
.IP_RANGE
: plage d'adresses IP à utiliser pour les règles de pare-feu SSH.
-
Facultatif : Pour vérifier que les ressources de réseau VPC ont bien été créées, vérifiez les paramètres réseau dans la console Google Cloud :
- Dans la console Google Cloud , accédez à la page Réseaux VPC.
- Recherchez dans la liste les réseaux que vous avez créés à l'étape précédente.
- Pour afficher les sous-réseaux, les règles de pare-feu et les autres paramètres réseau, cliquez sur le nom du réseau.
Créer l'instance
Pour créer une instance A3 Ultra ou A4, sélectionnez l'une des méthodes suivantes :
Créer une instance qui utilise une réservation
Pour créer une instance qui utilise une réservation, utilisez l'une des options suivantes :
Console
Dans la console Google Cloud , accédez à la page Créer une instance.
Accéder à la page Créer une instance
L'écran Créer une instance s'affiche et le volet Configuration de la machine s'ouvre.
Dans le volet Configuration de la machine, procédez comme suit :
Indiquez un Nom pour votre instance. Consultez la convention d'attribution de noms des ressources.
Sélectionnez la région et la zone dans lesquelles vous avez réservé de la capacité.
Cliquez sur l'onglet GPU, puis procédez comme suit :
Dans la liste Type de GPU, sélectionnez le type de GPU.
Pour les instances A4, sélectionnez NVIDIA B200.
Pour les instances A3 Ultra, sélectionnez NVIDIA H200 141 Go.
Dans la liste Nombre de GPU, sélectionnez 8.
Dans le menu de navigation, cliquez sur OS et stockage. Dans le volet OS et stockage qui s'affiche, procédez comme suit :
Cliquez sur Modifier. Le volet Configuration du disque de démarrage s'affiche.
Dans l'onglet Images publiques, sélectionnez une image recommandée. Pour obtenir la liste des images recommandées, consultez Systèmes d'exploitation.
Cliquez sur Sélectionner pour confirmer vos options de disque de démarrage.
Pour créer une instance multi-NIC, procédez comme suit. Sinon, ignorez ces étapes pour créer une instance à une seule interface réseau.
Dans le menu de navigation, cliquez sur Mise en réseau. Dans le volet Réseau qui s'affiche, procédez comme suit :
Dans la section Interfaces réseau, procédez comme suit :
Supprimez l'interface réseau par défaut. Pour supprimer l'interface, cliquez sur
Supprimer.Cliquez sur Ajouter une interface réseau. Utilisez cette option pour ajouter les réseaux gVNIC et RDMA que vous avez créés dans la section précédente. Lorsque vous ajoutez les réseaux, n'oubliez pas les points suivants :
Spécifiez vos réseaux hôtes dans les listes Réseau et Sous-réseau, puis définissez la liste Carte d'interface réseau sur gVNIC.
Spécifiez vos réseaux GPU dans les listes Réseau et Sous-réseau, puis définissez la liste Carte d'interface réseau sur MRDMA pour ces réseaux.
Dans le menu de navigation, cliquez sur Avancé. Dans le volet Avancé qui s'affiche, procédez comme suit :
Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation. Cette action ouvre un volet contenant la liste des réservations disponibles dans la zone sélectionnée. Dans la liste des réservations, procédez comme suit :
Sélectionnez la réservation que vous souhaitez utiliser pour la VM. Vous pouvez également sélectionner un bloc spécifique dans la réservation.
Cliquez sur Choisir.
Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.
Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (par défaut) ou Supprimer.
Pour créer et démarrer l'instance, cliquez sur Créer.
gcloud
Pour créer la VM, utilisez la commande
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --reservation-affinity=specific \ --reservation=RESERVATION \ --provisioning-model=RESERVATION_BOUND \ --instance-termination-action=TERMINATION_ACTION \ --maintenance-policy=TERMINATE
Remplacez les éléments suivants :
VM_NAME
: Nom de la VM.MACHINE_TYPE
: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY
: famille d'images de l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez Détails des systèmes d'exploitation.IMAGE_PROJECT
: ID du projet de l'image OS.ZONE
: zone dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Régions et zones de GPU.DISK_SIZE
: taille du disque de démarrage en GoGVNIC_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes gVNIC.RDMA_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.-
RESERVATION
: nom de la réservation ou d'un bloc spécifique dans une réservation. Pour obtenir le nom de la réservation ou les blocs disponibles, consultez Afficher la capacité réservée. En fonction de vos exigences concernant l'emplacement des instances, choisissez l'une des options suivantes :Pour créer l'instance sur un bloc :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
De plus, pour créer plusieurs instances dans le même bloc, appliquez la même stratégie d'emplacement compact qui spécifie une colocation de bloc (
maxDistance=2
) lors de la création de chaque instance. Compute Engine applique ensuite la règle à la réservation et crée des instances sur le même bloc.Pour créer l'instance sur un bloc spécifique :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: indique si Compute Engine arrête (STOP
) ou supprime (DELETE
) la VM à la fin de la période de réservation.
REST
Pour créer la VM, envoyez une requête
POST
à la méthodeinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "reservationAffinity":{ "consumeReservationType":"SPECIFIC_RESERVATION", "key":"compute.googleapis.com/reservation-name", "values":[ "RESERVATION" ] }, "scheduling":{ "provisioningModel":"RESERVATION_BOUND", "instanceTerminationAction":"TERMINATION_ACTION", "onHostMaintenance": "TERMINATE", "automaticRestart":true } }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel vous souhaitez créer la VM.ZONE
: zone dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Régions et zones de GPU.MACHINE_TYPE
: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.VM_NAME
: Nom de la VM.DISK_SIZE
: taille du disque de démarrage en GoIMAGE_PROJECT
: ID du projet de l'image OS.IMAGE_FAMILY
: famille d'images de l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez Détails des systèmes d'exploitation.NETWORK_PROJECT_ID
: ID du projet du réseau.GVNIC_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes gVNIC.REGION
: région du sous-réseau.RDMA_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.-
RESERVATION
: nom de la réservation ou d'un bloc spécifique dans une réservation. Pour obtenir le nom de la réservation ou les blocs disponibles, consultez Afficher la capacité réservée. En fonction de vos exigences concernant l'emplacement des instances, choisissez l'une des options suivantes :Pour créer l'instance sur un bloc :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
De plus, pour créer plusieurs instances dans le même bloc, appliquez la même stratégie d'emplacement compact qui spécifie une colocation de bloc (
maxDistance=2
) lors de la création de chaque instance. Compute Engine applique ensuite la règle à la réservation et crée des instances sur le même bloc.Pour créer l'instance sur un bloc spécifique :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
TERMINATION_ACTION
: indique si Compute Engine arrête (STOP
) ou supprime (DELETE
) la VM à la fin de la période de réservation.
Créer une VM Spot
Pour créer la VM Spot, utilisez l'une des options suivantes :
Console
Dans la console Google Cloud , accédez à la page Créer une instance.
Accéder à la page Créer une instance
L'écran Créer une instance s'affiche et le volet Configuration de la machine s'ouvre.
Dans le volet Configuration de la machine, procédez comme suit :
Indiquez un Nom pour votre instance. Consultez la convention d'attribution de noms des ressources.
Sélectionnez la région et la zone dans lesquelles vous souhaitez créer une VM. Pour vérifier dans quelles régions et zones les GPU sont disponibles, consultez Régions et zones GPU.
Cliquez sur l'onglet GPU, puis procédez comme suit :
Dans la liste Type de GPU, sélectionnez le type de GPU.
Pour les instances A4, sélectionnez NVIDIA B200.
Pour les instances A3 Ultra, sélectionnez NVIDIA H200 141 Go.
Dans la liste Nombre de GPU, sélectionnez 8.
Dans le menu de navigation, cliquez sur OS et stockage. Dans le volet OS et stockage qui s'affiche, procédez comme suit :
Cliquez sur Modifier. Le volet Configuration du disque de démarrage s'affiche.
Dans l'onglet Images publiques, sélectionnez une image recommandée. Pour obtenir la liste des images recommandées, consultez Systèmes d'exploitation.
Cliquez sur Sélectionner pour confirmer vos options de disque de démarrage.
Pour créer une instance multi-NIC, procédez comme suit. Sinon, ignorez ces étapes pour créer une instance à une seule interface réseau.
Dans le menu de navigation, cliquez sur Mise en réseau. Dans le volet Réseau qui s'affiche, procédez comme suit :
Dans la section Interfaces réseau, procédez comme suit :
Supprimez l'interface réseau par défaut. Pour supprimer l'interface, cliquez sur
Supprimer.Cliquez sur Ajouter une interface réseau. Utilisez cette option pour ajouter les réseaux gVNIC et RDMA que vous avez créés dans la section précédente. Lorsque vous ajoutez les réseaux, vous devez effectuer les opérations suivantes :
Spécifiez vos réseaux hôtes dans les listes Réseau et Sous-réseau, puis définissez la liste Carte d'interface réseau sur gVNIC.
Spécifiez vos réseaux GPU dans les listes Réseau et Sous-réseau, puis définissez la liste Carte d'interface réseau sur MRDMA pour ces réseaux.
Dans le menu de navigation, cliquez sur Avancé. Dans le volet Avancé qui s'affiche, procédez comme suit :
Dans la section Modèle de provisionnement, sélectionnez Spot dans la liste Modèle de provisionnement de VM.
Facultatif : Pour spécifier l'action à effectuer lorsque Compute Engine préempte l'instance, procédez comme suit :
Développez la section Paramètres avancés du modèle de provisionnement de VM.
Dans la liste À l'arrêt de la VM, sélectionnez Arrêter ou Supprimer.
Pour créer et démarrer l'instance, cliquez sur Créer.
gcloud
Pour créer la VM, utilisez la commande
gcloud compute instances create
.gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --boot-disk-type=hyperdisk-balanced \ --boot-disk-size=DISK_SIZE \ --scopes=cloud-platform \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \ --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \ --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \ --provisioning-model=SPOT \ --instance-termination-action=TERMINATION_ACTION
Remplacez les éléments suivants :
VM_NAME
: Nom de la VM.MACHINE_TYPE
: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY
: famille d'images de l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez Détails des systèmes d'exploitation.IMAGE_PROJECT
: ID du projet de l'image OS.ZONE
: zone dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Régions et zones de GPU.DISK_SIZE
: taille du disque de démarrage en GoGVNIC_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes gVNIC.RDMA_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.TERMINATION_ACTION
: action à effectuer lorsque Compute Engine préempte l'instance, soitSTOP
(par défaut), soitDELETE
.
REST
Pour créer la VM, envoyez une requête
POST
à la méthodeinstances.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType":"projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "name":"VM_NAME", "disks":[ { "boot":true, "initializeParams":{ "diskSizeGb":"DISK_SIZE", "diskType":"hyperdisk-balanced", "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY" }, "mode":"READ_WRITE", "type":"PERSISTENT" } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-nat", "type": "ONE_TO_ONE_NAT" } ], "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1", "nicType": "GVNIC", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6" }, { "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma", "nicType": "MRDMA", "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7" } ], "scheduling": { "provisioningModel": "SPOT", "instanceTerminationAction": "TERMINATION_ACTION" } }
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel vous souhaitez créer la VM.ZONE
: zone dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Régions et zones de GPU.MACHINE_TYPE
: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.VM_NAME
: Nom de la VM.DISK_SIZE
: taille du disque de démarrage en GoIMAGE_PROJECT
: ID du projet de l'image OS.IMAGE_FAMILY
: famille d'images de l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez Détails des systèmes d'exploitation.NETWORK_PROJECT_ID
: ID du projet du réseau.GVNIC_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes gVNIC.REGION
: région du sous-réseau.RDMA_NAME_PREFIX
: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.TERMINATION_ACTION
: action à effectuer lorsque Compute Engine préempte l'instance, soitSTOP
(par défaut), soitDELETE
.
Préparer l'instance pour l'utilisation
Pour préparer une instance à laquelle des GPU sont associés, procédez comme suit :
Pour qu'une instance A4 ou A3 Ultra puisse utiliser ses GPU associés, des pilotes de GPU doivent être installés sur l'instance. À moins que l'image de l'instance n'inclue déjà les pilotes de GPU requis, installez les pilotes de GPU.
Si vous avez créé une VM Spot dans la section précédente, procédez comme suit :
Pour préparer votre VM Spot à une éventuelle préemption, consultez Gérer la préemption des VM Spot.
Facultatif : Découvrez les bonnes pratiques pour les VM Spot.
Étapes suivantes
Pour surveiller les performances du GPU, consultez Surveiller les performances du GPU.
Pour résoudre les problèmes liés aux instances de GPU, consultez Résoudre les problèmes liés aux VM GPU.
Apprenez-en plus sur les plates-formes GPU.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/08 (UTC).
-