Cette page a été traduite par l'API Cloud Translation.

Famille de machines optimisées pour les accélérateurs

Ce document décrit la famille de machines optimisées pour les accélérateurs, qui vous fournit des instances de machines virtuelles (VM) avec des GPU NVIDIA pré-attachés. Ces instances sont conçues spécifiquement pour l'intelligence artificielle (IA), le machine learning (ML), le calcul hautes performances (HPC) et les applications gourmandes en ressources graphiques.

La famille de machines optimisées pour les accélérateurs est disponible dans les séries de machines A4X, A4, A3, A2, G4 et G2. Chaque type de machine d'une série est associé à un modèle spécifique et à un nombre de GPU NVIDIA. Vous pouvez également associer certains modèles de GPU à des types de machines à usage général N1.

Séries de machines recommandées par type de charge de travail

La section suivante fournit la série de machines recommandée en fonction de vos charges de travail GPU :

Type de charge de travail	Type de machine recommandé
Pré-entraînement des modèles	A4X, A4, A3 Ultra, A3 Mega, A3 High et A2 Pour identifier la solution la plus adaptée, consultez Recommandations pour les modèles de pré-entraînement dans la documentation AI Hypercomputer.
Affinage de modèles	A4X, A4, A3 Ultra, A3 Mega, A3 High, A2 et G4 Pour identifier la solution la plus adaptée, consultez Recommandations pour l'affinage des modèles dans la documentation AI Hypercomputer.
Diffuser l'inférence	A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 et G4 Pour identifier la solution la plus adaptée, consultez Recommandations pour diffuser l'inférence dans la documentation AI Hypercomputer.
Charges de travail exigeantes en ressources graphiques	G4, G2 et N1+T4
Calcul hautes performances	Pour les charges de travail de calcul hautes performances, toutes les séries de machines optimisées pour les accélérateurs fonctionnent bien. La machine la plus adaptée dépend de la quantité de calculs qui doit être déchargée sur le GPU. Pour en savoir plus, consultez Recommandations pour le HPC dans la documentation AI Hypercomputer.

Options de tarification et de consommation

Les options de consommation font référence aux différentes façons d'obtenir et d'utiliser des ressources de calcul. Google Cloud facture les types de machines optimisés pour les accélérateurs pour les GPU associés, les processeurs virtuels prédéfinis, la mémoire et le SSD local groupé (le cas échéant). Les remises pour les instances optimisées pour les accélérateurs varient en fonction de l'option de consommation que vous utilisez. Pour en savoir plus sur les tarifs des instances optimisées pour les accélérateurs, consultez la section Famille de types de machines optimisés pour les accélérateurs sur la page des tarifs des instances de VM.

Les remises pour les instances optimisées pour les accélérateurs varient en fonction de l'option de consommation que vous choisissez :

À la demande : vous pouvez bénéficier de remises sur engagement d'utilisation pour certaines ressources en souscrivant des engagements basés sur les ressources. Toutefois, les GPU et les disques SSD locaux que vous utilisez avec l'option à la demande ne sont pas éligibles aux CUD. Pour bénéficier de remises sur engagement d'utilisation pour les GPU et les disques SSD locaux, utilisez plutôt l'une des options de réservation.
Spot : les VM Spot bénéficient automatiquement de remises grâce à la tarification des VM Spot.
Démarrage flexible (aperçu) : les instances provisionnées à l'aide de l'option de consommation à démarrage flexible bénéficient automatiquement de remises grâce à la tarification du planificateur de charges de travail dynamique.
Réservations : vous pouvez bénéficier de remises sur engagement d'utilisation pour vos ressources de type de machine optimisé pour l'accélérateur en souscrivant des engagements basés sur les ressources. Les engagements pour les GPU et les disques SSD locaux nécessitent des réservations associées pour ces ressources.

Disponibilité des options d'utilisation par type de machine

Le tableau suivant récapitule la disponibilité de chaque option de consommation par série de machines. Pour savoir comment choisir une option de consommation, consultez Choisir un modèle de consommation dans la documentation AI Hypercomputer.

Type de machine	À la demande	Spot	Démarrage flexible (bêta)	Réservations à la demande	Réservations futures (aperçu)	Réservations futures en mode Agenda (Preview)	Réservations futures dans AI Hypercomputer (preview)
A4X
A4
A3 Ultra
A3 Mega A3 High avec 8 GPU A3 Edge
A3 High avec moins de 8 GPU
A2 Ultra et A2 Standard					¹
G4					¹
G2					¹

¹ Si vous souhaitez réserver des types de machines A2, G4 ou G2, vous devez contacter votre équipe de compte ou l'équipe commerciale pour discuter de votre future demande de réservation avant de l'envoyer. Sinon,Google Cloud est susceptible de refuser votre demande.

Série de machines A4X

La série de machines A4X s'exécute sur une plate-forme exascale basée sur l'architecture rack NVIDIA GB200 NVL72. Elle offre jusqu'à 140 vCPU et 884 Go de mémoire. Cette série de machines est optimisée pour les charges de travail de calcul et de mémoire intensifs, l'entraînement ML lié au réseau et les charges de travail HPC. La série de machines A4X n'est disponible qu'en un seul type de machine.

Les instances de VM créées à l'aide du type de machine A4X offrent les fonctionnalités suivantes :

Accélération GPU avec les superchips NVIDIA GB200 : les instances A4X sont automatiquement associées aux superchips NVIDIA GB200. Ces superchips sont équipés de GPU NVIDIA B200 et offrent 180 Go de mémoire par GPU. Les VM A4X disposent de deux sockets avec des processeurs NVIDIA Grace™ dotés de cœurs Arm® Neoverse™ V2. Ces processeurs sont connectés à quatre GPU B200 avec une communication rapide de puce à puce (NVLink-C2C).
Plate-forme de processeurs NVIDIA Grace : les instances A4X utilisent la plate-forme de processeurs NVIDIA Grace. Pour en savoir plus sur la plate-forme, consultez Plates-formes de processeur.
Évolutivité NVLink de pointe : NVLink multinœud qui peut évoluer jusqu'à 72 GPU dans un seul domaine. Les GPU NVIDIA B200 offrent une bande passante GPU NVLink de 1 800 Go/s, de manière bidirectionnelle par GPU. Avec une topologie globale NVLink répartie sur quatre GPU dans un même système, la bande passante globale NVLink peut atteindre 130 To/s.
Mise en réseau améliorée avec RoCE : pour les instances A4X, RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant les cartes d'interface réseau (NIC) NVIDIA ConnectX-7 (CX-7) avec le réseau Google à quatre voies alignées sur rail à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), les instances A4X atteignent un débit beaucoup plus élevé entre les instances d'un cluster par rapport aux instances A4.

Les cartes d'interface réseau CX-7, physiquement isolées dans une topologie réseau à quatre voies alignées, permettent aux instances A4X d'effectuer un scaling horizontal par groupes de 72 GPU jusqu'à des milliers de GPU dans un seul cluster non bloquant.

Remarque : En raison de la différence de topologie réseau, vous ne pouvez pas déplacer des charges de travail entre des instances A4X et des instances créées à l'aide d'autres séries de machines optimisées pour les accélérateurs de génération précédente.
Débits réseau améliorés : les débits réseau sont jusqu'à quatre fois plus rapides que ceux des instances créées à l'aide des types de machines A3.
Optimisations de la virtualisation pour les transferts et la récupération de données : la topologie PCIe (Peripheral Component Interconnect Express) des instances A4X fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.

Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Compatibilité avec les disques SSD locaux et Hyperdisk : 12 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A4X. Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.

Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez associer jusqu'à 512 Tio d'Hyperdisk aux instances A4X.
Prise en charge de l'allocation dense et de la planification tenant compte de la topologie : lorsque vous provisionnez des instances A4X, vous pouvez demander des blocs de capacité à allocation dense. Vos machines hôtes sont allouées physiquement à proximité les unes des autres, provisionnées sous forme de blocs de ressources et interconnectées avec un réseau ML dynamique pour minimiser les sauts de réseau et optimiser la latence la plus faible. A4X fournit également des informations sur la topologie au niveau des nœuds et des clusters, qui peuvent être utilisées pour le placement des jobs.

Type de machine A4X

Les types de machines A4X optimisés pour les accélérateurs utilisent des superchips NVIDIA GB200 Grace Blackwell (nvidia-gb200) et sont idéaux pour l'entraînement et le serving de modèles de base.

A4X est une plate-forme exascale basée sur NVIDIA GB200 NVL72. Chaque machine dispose de deux emplacements avec des processeurs NVIDIA Grace dotés de cœurs Arm Neoverse V2. Ces processeurs sont connectés à quatre GPU NVIDIA B200 Blackwell avec une communication NVLink-C2C rapide entre les puces.

						Superchips NVIDIA GB200 Grace Blackwell associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3e)
`a4x-highgpu-4g`	140	884	12 000	6	2 000	4	720

¹ Un processeur virtuel est mis en œuvre sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
² La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Pour en savoir plus sur la bande passante réseau, consultez Bande passante réseau.
³ La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de l'instance et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.

Limites des machines A4X

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A4X.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A4X.
Vous ne pouvez utiliser un type de machine A4X que dans certaines régions et zones.
Vous ne pouvez pas utiliser de disque persistant (régional ou zonal) sur une instance qui utilise un type de machine A4X.
Le type de machine A4X n'est disponible que sur la plate-forme NVIDIA Grace.
Attention : Le contrat de niveau de service Compute Engine ne s'applique pas à la série de machines A4X.
Vous ne pouvez pas modifier le type de machine d'une instance existante en type de machine A4X. Vous ne pouvez créer que des instances A4X. Une fois que vous avez créé une instance à l'aide d'un type de machine A4X, vous ne pouvez plus modifier le type de machine.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A4X.
Les instances A4X ne sont pas compatibles avec les éléments suivants :

Types de disques compatibles avec les instances A4X

Les instances A4X peuvent utiliser les types de stockage de blocs suivants :

Hyperdisk avec équilibrage (hyperdisk-balanced) : il s'agit du seul type de disque compatible avec le disque de démarrage.
Hyperdisque extrême (hyperdisk-extreme)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A4X

Nombre maximal de disques par instance¹
Types de machine	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	SSD local associé
`a4x-highgpu-4g`	128	128	N/A	N/A	8	32

¹ L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.

Limites de disque et de capacité

Vous pouvez associer une combinaison de différents types d'Hyperdisk à une instance, mais la capacité totale maximale de disque (en Tio) pour tous les types de disques ne peut pas dépasser 512 Tio pour tous les Hyperdisks.

Pour en savoir plus sur les limites de capacité, consultez Limites de taille et de nombre de volumes Hyperdisk.

Série de machines A4

La série de machines A4 propose des types de machines avec jusqu'à 224 processeurs virtuels et 3 968 Go de mémoire. Les instances A4 offrent des performances jusqu'à trois fois supérieures à celles des types d'instances GPU précédents pour la plupart des charges de travail accélérées par GPU. La famille A4 est recommandée pour les charges de travail d'entraînement au ML, en particulier à grande échelle (par exemple, des centaines ou des milliers de GPU). La série de machines A4 n'est disponible que dans un seul type de machine.

Les instances de VM créées à l'aide du type de machine A4 offrent les fonctionnalités suivantes :

Accélération GPU avec les GPU NVIDIA B200 : les GPU NVIDIA B200 sont automatiquement associés aux instances A4, qui offrent 180 Go de mémoire GPU par GPU.
Processeur évolutif Intel Xeon de 5e génération (Emerald Rapids) : offre une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 4,0 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur.
Évolutivité NVLink de pointe : les GPU NVIDIA B200 fournissent une bande passante GPU NVLink de 1 800 Go/s, de manière bidirectionnelle par GPU.

Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 14,4 To/s.
Mise en réseau améliorée avec RoCE : RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant les cartes d'interface réseau (NIC) NVIDIA ConnectX-7 avec le réseau Google aligné sur quatre rails à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), les instances A4 atteignent un débit beaucoup plus élevé entre les instances d'un cluster par rapport à la plupart des instances A3, à l'exception de celles exécutées sur le type de machine A3 Ultra.

Remarque : En raison de la différence de topologie réseau, vous ne pouvez pas déplacer des charges de travail entre les instances A4 et les instances créées à l'aide de l'une des séries de machines optimisées pour les accélérateurs de génération précédente. Vous ne pouvez déplacer des charges de travail qu'entre des instances exécutées sur des types de machines A4 et A3 Ultra.
Vitesse réseau accrue : jusqu'à quatre fois plus rapide que les instances A2 de la génération précédente.

Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU.
Optimisations de la virtualisation pour les transferts et la récupération de données : la topologie PCIe (Peripheral Component Interconnect Express) des instances A4 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.

Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Compatibilité avec les disques SSD locaux et Hyperdisk : 12 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A4. Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.

Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez également associer jusqu'à 512 Tio d'Hyperdisk aux instances A4.
Prise en charge de l'allocation dense et de la planification tenant compte de la topologie : lorsque vous provisionnez des instances A4, vous pouvez demander des blocs de capacité à allocation dense. Vos machines hôtes sont allouées à proximité les unes des autres, provisionnées sous forme de blocs de ressources et interconnectées avec un réseau ML dynamique pour minimiser les sauts de réseau et optimiser la latence la plus faible. Vous pouvez également obtenir des informations sur la topologie au niveau des nœuds et des clusters, qui peuvent être utilisées pour le placement des jobs.

Type de machine A4

Les types de machines A4 optimisés pour les accélérateurs sont associés à des GPU NVIDIA B200 Blackwell (nvidia-b200). Ils sont idéaux pour l'entraînement et le service de modèles de base.

						GPU NVIDIA B200 Blackwell associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3e)
`a4-highgpu-8g`	224	3 968	12 000	10	3 600	8	1 440

Limites des machines A4

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A4.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A4.
Vous ne pouvez utiliser un type de machine A4 que dans certaines régions et zones.
Vous ne pouvez pas utiliser de disque persistant (régional ou zonal) sur une instance qui utilise un type de machine A4.
Le type de machine A4 n'est disponible que sur la plate-forme de processeur Emerald Rapids.
Vous ne pouvez pas remplacer le type de machine d'une instance existante par un type de machine A4. Vous ne pouvez créer que des instances A4. Une fois que vous avez créé une instance à l'aide d'un type de machine A4, vous ne pouvez plus modifier le type de machine.
Les types de machines A4 ne sont pas compatibles avec la location unique.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A4.

Types de disques compatibles avec les instances A4

Les instances A4 peuvent utiliser les types de stockage de blocs suivants :

Hyperdisk avec équilibrage (hyperdisk-balanced) : il s'agit du seul type de disque compatible avec le disque de démarrage.
Hyperdisque extrême (hyperdisk-extreme)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A4

Nombre maximal de disques par instance¹
Types de machine	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	SSD local associé
`a4-highgpu-8g`	128	128	N/A	N/A	8	32

¹ L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.

Limites de disque et de capacité

Pour en savoir plus sur les limites de capacité, consultez Limites de taille et de nombre de volumes Hyperdisk.

Série de machines A3

La série de machines A3 dispose de jusqu'à 224 processeurs virtuels et de 2 944 Go de mémoire. Cette série de machines est optimisée pour les charges de travail de calcul et de mémoire intensives, d'entraînement au ML lié au réseau et de HPC. La série de machines A3 est disponible dans les types de machines A3 Ultra, A3 Mega, A3 High et A3 Edge.

Les instances de VM créées à l'aide des types de machines A3 offrent les fonctionnalités suivantes :

Fonctionnalité	A3 Ultra	A3 Mega, High, Edge
Accélération GPU	GPU NVIDIA H200 SXM : ils offrent 141 Go de mémoire GPU par GPU, ce qui permet de disposer d'une mémoire plus grande et plus rapide pour prendre en charge les grands modèles de langage et les charges de travail HPC.	GPU NVIDIA H100 SXM : chaque type de machine A3 est associé à des GPU NVIDIA H100 SXM, qui offrent 80 Go de mémoire par GPU et sont idéaux pour les modèles de langage volumineux basés sur les transformateurs, les bases de données et le HPC.
Processeurs Intel Xeon Scalable	Processeur Intel Xeon Scalable de 5e génération (Emerald Rapids) offrant une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 4,0 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur.	Processeur évolutif Intel Xeon de 4e génération (Sapphire Rapids) offrant une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 3,3 GHz. Pour en savoir plus sur ce processeur, consultez Plate-forme de processeur.
Évolutivité NVLink de pointe	Les GPU NVIDIA H200 fournissent une bande passante GPU NVLink maximale de 900 Go/s, de manière unidirectionnelle. Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s.	Les GPU NVIDIA H100 fournissent une bande passante GPU NVLink maximale de 450 Go/s, de manière unidirectionnelle. Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s.
Mise en réseau améliorée	Pour ce type de machine, RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant des cartes d'interface réseau (NIC) NVIDIA ConnectX-7 avec notre réseau à quatre voies alignées sur rail à l'échelle du centre de données. En tirant parti de RDMA over Converged Ethernet (RoCE), le type de machine `a3-ultragpu-8g` atteint un débit beaucoup plus élevé entre les instances d'un cluster par rapport aux autres types de machines A3. Remarque : En raison de la différence de topologie réseau entre A3 Ultra et la série A3 précédente (A3 Mega, High et Edge), vous ne pouvez pas déplacer de charges de travail entre des instances qui s'exécutent sur A3 Ultra et la série A3 précédente.	Pour les types de machines A3 Mega, GPUDirect-TCPXO améliore encore GPUDirect-TCPX en déchargeant le protocole TCP. En tirant parti de GPUDirect-TCPXO, le type de machine `a3-megagpu-8g` double la bande passante réseau par rapport aux types de machines A3 High et A3 Edge. Pour les types de machines A3 Edge et A3 High, GPUDirect-TCPX améliore les performances réseau en permettant aux charges utiles des paquets de données d'être transférées directement de la mémoire GPU vers l'interface réseau. En tirant parti de GPUDirect-TCPX, ces types de machines atteignent un débit beaucoup plus élevé entre les instances d'un cluster par rapport aux types de machines A2 ou G2 optimisés pour les accélérateurs.
Amélioration de la vitesse du réseau	Offre des vitesses réseau jusqu'à quatre fois supérieures à celles de la série de machines A2 de la génération précédente. Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU.	Offre des vitesses de mise en réseau jusqu'à 2,5 fois supérieures à celles de la série de machines A2 de la génération précédente. Pour en savoir plus sur la mise en réseau, consultez Bandes passantes réseau et GPU.
Optimisations de la virtualisation	La topologie PCIe (Peripheral Component Interconnect Express) des instances A3 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données. Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques	Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S. Le disque SSD local est associé comme suit : 12 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A3 Ultra. 6 000 Gio de disque SSD local sont automatiquement ajoutés aux instances A3 Mega, High et Edge. Vous pouvez également associer jusqu'à 512 Tio de stockage Persistent Disk et Hyperdisk aux types de machines de ces séries pour les applications nécessitant des performances de stockage plus élevées. Pour certains types de machines, jusqu'à 257 Tio de disque persistant sont également acceptés.
Prise en charge des stratégies d'emplacement compact	Vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez À propos des stratégies d'emplacement compact. Attention : Par défaut, vous ne pouvez pas appliquer de stratégies d'emplacement compact avec une valeur de distance maximale aux VM A3 dans Compute Engine. Pour demander l'accès à cette fonctionnalité, contactez votre responsable de compte technique (TAM) ou l'équipe commerciale.

Type de machine A3 Ultra

Les types de machines A3 Ultra sont associés à des GPU NVIDIA H200 SXM (nvidia-h200-141gb) et offrent les meilleures performances réseau de la série A3. Les types de machines A3 Ultra sont idéaux pour l'entraînement et le service de modèles de fondation.

						GPU NVIDIA H200 associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3e)
`a3-ultragpu-8g`	224	2 952	12 000	10	3 600	8	1128

Limites des machines A3 Ultra

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A3 Ultra.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A3 Ultra.
Vous ne pouvez utiliser un type de machine A3 Ultra que dans certaines régions et zones.
Vous ne pouvez pas utiliser de Persistent Disk (régional ou zonal) sur une instance qui utilise un type de machine A3 Ultra.
Le type de machine A3 Ultra n'est disponible que sur la plate-forme de processeur Emerald Rapids.
Vous ne pouvez pas modifier le type de machine d'une instance existante en type de machine A3 Ultra. Vous ne pouvez créer que des instances A3-ultra. Une fois que vous avez créé une instance à l'aide d'un type de machine A3 Ultra, vous ne pouvez pas modifier le type de machine.
Les types de machines A3 Ultra ne sont pas compatibles avec la location unique.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Ultra.

Type de machine A3 Mega

Les types de machines A3 Mega sont associés à des GPU NVIDIA H100 SXM et sont idéaux pour l'entraînement de grands modèles et l'inférence multihôte.

Conseil : Lorsque vous provisionnez des types de machines a3-megagpu-8g, nous vous recommandons d'utiliser un cluster de ces instances et de le déployer avec un programmeur tel que Google Kubernetes Engine (GKE) ou Slurm. Pour obtenir des instructions détaillées sur ces deux options, consultez les pages suivantes :

Pour créer un cluster Google Kubernetes Engine, consultez Déployer un cluster A3 Mega avec GKE.
Pour créer un cluster Slurm, consultez Déployer un cluster Slurm A3 Mega.

						GPU NVIDIA H100 associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3)
`a3-megagpu-8g`	208	1 872	6 000	9	1 800	8	640

Limites des machines A3 Mega

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A3 Mega.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A3 Mega.
Vous ne pouvez utiliser un type de machine A3 Mega que dans certaines régions et zones.
Vous ne pouvez pas utiliser de Persistent Disk régional sur une instance qui utilise un type de machine A3 Mega.
Le type de machine A3 Mega n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
Vous ne pouvez pas remplacer le type de machine d'une instance existante par un type de machine A3 Mega. Vous ne pouvez créer que des instances A3-mega. Une fois que vous avez créé une instance à l'aide d'un type de machine A3 Mega, vous ne pouvez plus modifier le type de machine.
Les types de machines A3 Mega ne sont pas compatibles avec la location unique.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Mega.

Type de machine A3 High

Les types de machines A3 High sont associés à des GPU NVIDIA H100 SXM et conviennent aussi bien à l'inférence de grands modèles qu'à leur ajustement fin.

Conseil : Lorsque vous provisionnez des types de machines a3-highgpu-1g, a3-highgpu-2g ou a3-highgpu-4g, vous devez créer des instances à l'aide de VM Spot ou de VM à démarrage flexible. Pour obtenir des instructions détaillées sur ces options, consultez les pages suivantes :

Pour créer des VM Spot, définissez le modèle de provisionnement sur SPOT lorsque vous créez une VM optimisée pour les accélérateurs.
Pour créer des VM Flex-start, vous pouvez utiliser l'une des méthodes suivantes :
- Créez une VM autonome et définissez le modèle de provisionnement sur FLEX_START lorsque vous créez une VM optimisée pour les accélérateurs.
- Créez une demande de redimensionnement dans un groupe d'instances géré (MIG). Pour obtenir des instructions, consultez Créer un MIG comprenant des VM avec GPU.

						GPU NVIDIA H100 associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3)
`a3-highgpu-1g`	26	234	750	1	25	1	80
`a3-highgpu-2g`	52	468	1 500	1	50	2	160
`a3-highgpu-4g`	104	936	3 000	1	100	4	320
`a3-highgpu-8g`	208	1 872	6 000	5	1 000	8	640

Limites des machines A3 High

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A3 High.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A3 High.
Vous ne pouvez utiliser un type de machine A3 High que dans certaines régions et zones.
Vous ne pouvez pas utiliser de Persistent Disk régional sur une instance qui utilise un type de machine A3 High.
Le type de machine A3 High n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
Vous ne pouvez pas modifier le type de machine d'une instance existante en type de machine A3 High. Vous ne pouvez créer que des instances A3-high. Une fois que vous avez créé une instance à l'aide d'un type de machine A3 High, vous ne pouvez pas modifier le type de machine.
Les types de machines A3 High ne sont pas compatibles avec la location unique.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 High.
Pour les types de machines a3-highgpu-1g, a3-highgpu-2g et a3-highgpu-4g, vous devez créer des instances à l'aide de VM Spot ou de VM à démarrage flexible. Pour obtenir des instructions détaillées sur ces options, consultez les pages suivantes :
- Pour créer des VM Spot, définissez le modèle de provisionnement sur SPOT lorsque vous créez une VM optimisée pour les accélérateurs.
- Pour créer des VM Flex-start, vous pouvez utiliser l'une des méthodes suivantes :
  - Créez une VM autonome et définissez le modèle de provisionnement sur FLEX_START lorsque vous créez une VM optimisée pour les accélérateurs.
  - Créez une demande de redimensionnement dans un groupe d'instances géré (MIG). Pour obtenir des instructions, consultez Créer un MIG comprenant des VM avec GPU.
Vous ne pouvez utiliser une Confidential VM avec un type de machine a3-highgpu-1g que dans certaines régions et zones. De plus, toutes les limites applicables aux Confidential VM exécutées sur le type de machine A3 High s'appliquent.

Type de machine A3 Edge

Les types de machines A3 Edge sont dotés de GPU NVIDIA H100 SXM et sont conçus spécifiquement pour le traitement. Ils sont disponibles dans un ensemble limité de régions.

						GPU NVIDIA H100 associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM3)
`a3-edgegpu-8g`	208	1 872	6 000	5	800 : pour asia-south1 et northamerica-northeast2 400 : pour toutes les autres régions A3 Edge	8	640

Limites des machines A3 Edge

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A3 Edge.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A3 Edge.
Vous ne pouvez utiliser un type de machine A3 Edge que dans certaines régions et zones.
Vous ne pouvez pas utiliser de Persistent Disk régional sur une instance qui utilise un type de machine A3 Edge.
Le type de machine A3 Edge n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
Vous ne pouvez pas modifier le type de machine d'une instance existante en type de machine A3 Edge. Vous ne pouvez créer que des instances A3-edge. Une fois que vous avez créé une instance à l'aide d'un type de machine A3 Edge, vous ne pouvez plus modifier le type de machine.
Les types de machines A3 Edge ne sont pas compatibles avec la location unique.
Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Edge.

Types de disques compatibles avec les instances A3

A3 Ultra

Les instances A3 Ultra peuvent utiliser les types de stockage de blocs suivants :

Hyperdisk avec équilibrage (hyperdisk-balanced) : il s'agit du seul type de disque compatible avec le disque de démarrage.
Volume Hyperdisk équilibré à haute disponibilité (hyperdisk-balanced-high-availability)
Hyperdisque extrême (hyperdisk-extreme)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A3

Nombre maximal de disques par instance¹
Types de machines	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Haute disponibilité sur Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	Disques SSD locaux associés
`a3-ultragpu-8g`	128	128	128	N/A	N/A	8	32

¹ L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.

A3 Mega

Les instances A3 Mega peuvent utiliser les types de stockage de blocs suivants :

Disque persistant avec équilibrage (pd-balanced)
Disque persistant SSD (performances, pd-ssd)
Volume Hyperdisk équilibré (hyperdisk-balanced)
Volume Hyperdisk équilibré à haute disponibilité (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisque extrême (hyperdisk-extreme)
Débit hyperdisque (hyperdisk-throughput)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A3

Nombre maximal de disques par instance¹
Types de machines	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Haute disponibilité sur Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	Disques SSD locaux associés
`a3-megagpu-8g`	128	32	32	64	64	8	16

¹ L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez Tarifs de Persistent Disk et Hyperdisk.

A3 High

Les instances A3 High peuvent utiliser les types de stockage de blocs suivants :

Disque persistant avec équilibrage (pd-balanced)
Disque persistant SSD (performances, pd-ssd)
Volume Hyperdisk équilibré (hyperdisk-balanced)
Volume Hyperdisk équilibré à haute disponibilité (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisque extrême (hyperdisk-extreme)
Débit hyperdisque (hyperdisk-throughput)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A3

Nombre maximal de disques par instance¹
Types de machines	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Haute disponibilité sur Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	Disques SSD locaux associés
`a3-highgpu-1g`	128	32	32	64	64	N/A	2
`a3-highgpu-2g`	128	32	32	64	64	N/A	4
`a3-highgpu-4g`	128	32	32	64	64	8	8
`a3-highgpu-8g`	128	32	32	64	64	8	16

A3 Edge

Les instances A3 Edge peuvent utiliser les types de stockage de blocs suivants :

Disque persistant avec équilibrage (pd-balanced)
Disque persistant SSD (performances, pd-ssd)
Volume Hyperdisk équilibré (hyperdisk-balanced)
Volume Hyperdisk équilibré à haute disponibilité (hyperdisk-balanced-high-availability)
Hyperdisk ML (hyperdisk-ml)
Hyperdisque extrême (hyperdisk-extreme)
Débit hyperdisque (hyperdisk-throughput)
SSD local : ajouté automatiquement aux instances créées à l'aide de l'un des types de machines A3

Nombre maximal de disques par instance¹
Types de machine	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Haute disponibilité sur Hyperdisk équilibré	Hyperdisk Throughput	Hyperdisk ML	Hyperdisk Extreme	SSD local associé
`a3-edgegpu-8g`	128	32	32	64	64	8	16

Limites de disque et de capacité

Si le type de machine le permet, vous pouvez associer une combinaison de volumes Hyperdisk et Persistent Disk à une instance, mais les restrictions suivantes s'appliquent :

Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par instance.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
- Pour les types de machines avec moins de 32 vCPU:
  - 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
  - 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- Pour les types de machines comportant 32 vCPU ou plus:
  - 512 Tio pour tous les volumes Hyperdisk
  - 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
  - 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.

Série de machines A2

La série de machines A2 est disponible dans les types de machines A2 standard et A2 ultra. Ces types de machines disposent de 12 à 96 processeurs virtuels et de 1 360 Go de mémoire.

Les instances de VM créées à l'aide des types de machines A2 offrent les fonctionnalités suivantes :

Accélération GPU : chaque instance A2 dispose de GPU NVIDIA A100. Elles sont disponibles dans les options A100 40 Go et A100 80 Go.
Évolutivité NVLink de pointe qui fournit un pic de bande passante GPU à GPU NVLink de 600 Gbit/s. Par exemple, les systèmes avec 16 GPU disposent d'une bande passante globale NVLink pouvant atteindre 9,6 To. Ces 16 GPU peuvent être utilisés comme accélérateur hautes performances unique équipé d'un espace de mémoire unifié pour fournir jusqu'à 10 pétaflops de puissance de calcul et jusqu'à 20 pétaflops de puissance de calcul d'inférence pouvant servir pour l'intelligence artificielle, ainsi que les charges de travail de deep learning et de machine learning.
Vitesse de calcul améliorée : les GPU NVIDIA A100 associées offrent une vitesse de calcul jusqu'à 10 fois supérieure à celle des GPU NVIDIA V100 de la génération précédente.

Avec la série de machines A2, vous pouvez obtenir jusqu'à 100 Gbit/s de bande passante réseau.
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques : pour les espaces de travail rapides ou pour alimenter les GPU en données, tout en évitant les goulots d'étranglement d'E/S, les types de machines A2 sont compatibles avec les disques SSD locaux comme suit :
- Pour les types de machines A2 standards, vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local lorsque vous créez une instance.
- Pour les types de machines ultra A2, le disque SSD local est automatiquement associé lorsque vous créez une instance.
Pour les applications nécessitant des performances de stockage plus élevées, vous pouvez également associer jusqu'à 257 Tio de volumes Persistent Disk et 512 Tio de volumes Hyperdisk aux instances A2.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.

Les types de machines suivants sont disponibles pour la série de machines A2.

Types de machines ultra A2

Ces types de machines ont un nombre fixe de GPU A100 80 Go. Le disque SSD local est automatiquement associé aux instances créées à l'aide des types de machines ultra A2.

					GPU NVIDIA A100 80 Go associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local associé (Gio)	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM2e)
`a2-ultragpu-1g`	12	170	375	24	1	80
`a2-ultragpu-2g`	24	340	750	32	2	160
`a2-ultragpu-4g`	48	680	1 500	50	4	320
`a2-ultragpu-8g`	96	1 360	3 000	100	8	640

Limites des machines ultra A2

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A2 Ultra.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A2 Ultra.
Vous ne pouvez utiliser un type de machine A2 Ultra que dans certaines régions et zones.
Les types de machines A2 Ultra ne sont disponibles que sur la plate-forme Cascade Lake.
Si votre instance utilise un type de machine A2 Ultra, vous ne pouvez pas le modifier. Si vous devez utiliser un autre type de machine A2 Ultra ou toute autre famille de machines, vous devez créer une instance.
Vous ne pouvez pas remplacer un autre type de machine par un type de machine A2 Ultra. Si vous avez besoin d'une instance utilisant un type de machine A2 Ultra, vous devez en créer une.
Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des instances Windows qui utilisent des types de machines A2 Ultra. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant format fs=ntfs label=tmpfs.

Types de machines A2 standards

Ces types de machines ont un nombre fixe de GPU A100 40 Go. Vous pouvez également ajouter des disques SSD locaux lorsque vous créez une instance A2 Standard. Pour connaître le nombre de disques que vous pouvez associer, consultez Types de machines nécessitant le choix d'un nombre de disques SSD locaux.

					GPU NVIDIA A100 40 Go associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	SSD local compatible	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (GB HBM2)
`a2-highgpu-1g`	12	85	Oui	24	1	40
`a2-highgpu-2g`	24	170	Oui	32	2	80
`a2-highgpu-4g`	48	340	Oui	50	4	160
`a2-highgpu-8g`	96	680	Oui	100	8	320
`a2-megagpu-16g`	96	1 360	Oui	100	16	640

Limites des types de machines A2 standards

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine A2 Standard.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine A2 Standard.
Vous ne pouvez utiliser un type de machine A2 Standard que dans certaines régions et zones.
Les types de machines A2 Standard ne sont disponibles que sur la plate-forme Cascade Lake.
Si votre instance utilise un type de machine A2 Standard, vous ne pouvez passer d'un type de machine A2 Standard qu'à un autre type de machine A2 Standard. Vous ne pouvez pas passer à un autre type de machine. Pour en savoir plus, consultez Modifier des instances optimisées pour les accélérateurs.
Vous ne pouvez pas utiliser le système d'exploitation Windows avec le type de machine a2-megagpu-16g. Lorsque vous utilisez un système d'exploitation Windows, choisissez un autre type de machine A2 standard.
Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des instances Windows qui utilisent des types de machines A2 Standard. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant format fs=ntfs label=tmpfs.
Les types de machines A2 Standard ne sont pas compatibles avec la location unique.

Types de disques compatibles avec les instances A2

Les instances A2 peuvent utiliser les types de stockage de blocs suivants :

Hyperdisk ML (hyperdisk-ml)
Disque persistant avec équilibrage (pd-balanced)
Disque persistant SSD (performances, pd-ssd)
Disque persistant standard (pd-standard)
SSD local : il est automatiquement associé aux instances créées à l'aide des types de machines ultra A2.

Si le type de machine le permet, vous pouvez associer une combinaison de volumes Hyperdisk et Persistent Disk à une instance, mais les restrictions suivantes s'appliquent :

Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par instance.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
- Pour les types de machines avec moins de 32 vCPU:
  - 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
  - 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- Pour les types de machines comportant 32 vCPU ou plus:
  - 512 Tio pour tous les volumes Hyperdisk
  - 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
  - 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.

Série de machines G4

La série de machines G4 utilise la plate-forme de processeur AMD EPYC Turin et comprend des GPU NVIDIA RTX PRO 6000 Blackwell Server Edition. Cette série de machines offre des améliorations significatives par rapport à la série de machines G2 de la génération précédente, avec beaucoup plus de mémoire GPU, une bande passante de mémoire GPU accrue et une bande passante réseau plus élevée.

Les instances G4 disposent de jusqu'à 384 processeurs virtuels, 1 440 Go de mémoire et 12 Tio de disques SSD Titanium. Les instances G4 offrent également des performances réseau standard pouvant atteindre 400 Gbit/s.

Cette série de machines est particulièrement adaptée aux charges de travail telles que les charges de travail de simulation NVIDIA Omniverse, les applications gourmandes en ressources graphiques, le transcodage vidéo et les postes de travail virtuels. La série de machines G4 offre également une solution à faible coût pour effectuer l'inférence et l'ajustement de modèle sur un seul hôte, par rapport aux types de machines de la série A.

Les instances qui utilisent le type de machine G4 offrent les fonctionnalités suivantes :

Accélération GPU avec les GPU NVIDIA RTX PRO 6000 Blackwell Server Edition : les instances G4 associent automatiquement les GPU NVIDIA RTX PRO 6000 Blackwell Server Edition, qui offrent 96 Go de mémoire GPU par GPU.
Plate-forme de CPU AMD EPYC Turin de 5e génération : cette plate-forme offre une fréquence boost maximale soutenue allant jusqu'à 4,1 GHz. Pour en savoir plus sur ce processeur, consultez Plates-formes de processeur.
Performances graphiques de nouvelle génération : les GPU NVIDIA RTX PRO 6000 offrent des performances et des fonctionnalités nettement améliorées par rapport aux GPU NVIDIA L4 associés à la série de machines G2. Voici les mises à niveau :
- Cœurs Tensor de 5e génération : ces cœurs sont compatibles avec la précision FP4 et la génération multiframe DLSS 4. Grâce à ces Tensor Cores de 5e génération, les GPU NVIDIA RTX PRO 6000 offrent des performances améliorées pour accélérer des tâches telles que le développement de LLM locaux et la création de contenu, par rapport aux GPU NVIDIA L4.
- Cœurs RT de 4e génération : ces cœurs offrent des performances de ray tracing jusqu'à deux fois supérieures à celles des GPU NVIDIA L4 de la génération précédente, ce qui accélère le rendu pour les charges de travail de conception et de fabrication.
- Nombre de cœurs : le GPU NVIDIA RTX PRO 6000 comprend 24 064 cœurs CUDA, 752 cœurs Tensor de 5e génération et 188 cœurs RT de 4e génération. Cette mise à jour représente une augmentation considérable par rapport aux générations précédentes, comme le GPU L4,qui dispose de 7 680 cœurs CUDA et de 240 cœurs Tensor.
GPU multi-instance (MIG) : cette fonctionnalité permet de partitionner un seul GPU en quatre instances GPU entièrement isolées sur une seule instance de VM. Pour en savoir plus sur NVIDIA MIG, consultez NVIDIA Multi-Instance GPU dans la documentation NVIDIA.
Compatibilité avec Peripheral Component Interconnect Express (PCIe) Gen 5 : les instances G4 sont compatibles avec PCI Express Gen 5, ce qui améliore la vitesse de transfert des données de la mémoire du processeur vers le GPU par rapport à PCIe Gen 3 utilisé par les instances G2.
Compatibilité avec les disques Titanium SSD et Hyperdisk : les instances G4 sont compatibles avec l'association de jusqu'à 12 000 Gio de Titanium SSD. Les disques SSD Titanium fournissent des espaces de travail rapides ou alimentent les GPU en données, ce qui permet d'éviter les goulots d'étranglement d'E/S.

Pour les charges de travail nécessitant un stockage de blocs durable, les instances G4 permettent également d'associer jusqu'à 512 Tio d'Hyperdisk. Pour en savoir plus sur les types de disques, consultez Types de disques.
Communication GPU peer-to-peer (P2P) : les instances G4 sont compatibles avec la communication GPU P2P, ce qui permet le transfert direct de données entre les GPU d'une même instance. Cela peut améliorer considérablement les performances des charges de travail multi-GPU en réduisant la latence de transfert des données et en libérant des ressources CPU. Pour en savoir plus, consultez Communication peer-to-peer (P2P) des GPU G4.

Types de machines G4

Les types de machines G4 optimisés pour les accélérateurs utilisent des GPU NVIDIA RTX PRO 6000 Blackwell Server Edition (nvidia-rtx-pro-6000) et conviennent aux charges de travail de simulation NVIDIA Omniverse, aux applications gourmandes en ressources graphiques, au transcodage vidéo et aux postes de travail virtuels. Les types de machines G4 offrent également une solution à faible coût pour effectuer l'inférence et l'ajustement de modèles sur un seul hôte par rapport aux types de machines de la série A.

						GPU NVIDIA RTX PRO 6000 associés
Type de machine	Nombre de vCPU¹	Mémoire de l'instance (Go)	Disque SSD Titanium maximal compatible (Gio)²	Nombre de cartes d'interface réseau physiques	Bande passante réseau maximale (Gbit/s)³	Nombre de GPU	Mémoire GPU⁴ (Go GDDR7)
`g4-standard-48`	48	180	1 500	1	50	1	96
`g4-standard-96`	96	360	3 000	1	100	2	192
`g4-standard-192`	192	720	6 000	1	200	4	384
`g4-standard-384`	384	1 440	12 000	2	400	8	768

¹ Un processeur virtuel est mis en œuvre sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
² Vous pouvez ajouter des disques SSD Titanium lorsque vous créez une instance G4. Pour connaître le nombre de disques que vous pouvez associer, consultez Types de machines nécessitant le choix d'un nombre de disques SSD locaux.
³ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.
⁴ La mémoire du GPU est la mémoire disponible sur un GPU pouvant être utilisé pour le stockage temporaire de données. Elle est distincte de la mémoire de l'instance et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.

Limites des machines G4

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine G4.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine G4.
Vous ne pouvez utiliser un type de machine G4 que dans certaines régions et zones.
Vous ne pouvez pas utiliser de Persistent Disk (régional ou zonal) sur une instance qui utilise un type de machine G4.
Le type de machine G4 n'est disponible que sur la plate-forme AMD EPYC Turin de 5e génération.
Vous ne pouvez pas créer d'instances de VM confidentielles qui utilisent un type de machine G4.
Vous ne pouvez pas créer d'instances G4 sur des nœuds à locataire unique.
Vous ne pouvez pas utiliser de systèmes d'exploitation Windows sur les instances g4-standard-384.

Types de disques compatibles avec les instances G4

Les instances G4 peuvent utiliser les types de stockage de blocs suivants :

Hyperdisk avec équilibrage (hyperdisk-balanced) : il s'agit du seul type de disque compatible avec le disque de démarrage.
Volume Hyperdisk équilibré à haute disponibilité (hyperdisk-balanced-high-availability)
Hyperdisque extrême (hyperdisk-extreme)
Hyperdisk ML (hyperdisk-ml)
Débit hyperdisque (hyperdisk-throughput)
SSD Titanium : vous pouvez ajouter un SSD Titanium aux instances créées à l'aide des types de machines G4.

Nombre maximal de disques par instance¹
Types de machine	Tous les volumes Hyperdisk	Volume Hyperdisk équilibré	Haute disponibilité sur Hyperdisk équilibré	Hyperdisk Extreme	Hyperdisk ML	Hyperdisk Throughput	Titanium SSD
`g4-standard-48`	32	32	32	0	32	32	4
`g4-standard-96`	32	32	32	8	32	32	8
`g4-standard-192`	64	64	64	8	64	64	16
`g4-standard-384`	128	128	128	8	128	128	32

¹ L'utilisation des hyperdisques et le tarif par type de machine sont facturés séparément. Pour connaître les tarifs des disques, consultez Tarifs d'Hyperdisk.

Pour en savoir plus sur les limites de capacité, consultez Limites de taille et de nombre de volumes Hyperdisk.

Communication peer-to-peer (P2P) G4

Les instances G4 améliorent les performances des charges de travail multi-GPU en utilisant la communication GPU peer-to-peer (P2P) directe. Cette fonctionnalité permet aux GPU associés à la même instance G4 d'échanger des données directement sur le bus PCIe, ce qui évite de devoir transférer des données via la mémoire principale du processeur. Ce chemin direct réduit la latence, diminue l'utilisation du processeur et augmente la bande passante effective entre les GPU. La communication P2P accélère considérablement les applications multi-GPU telles que l'entraînement au machine learning (ML) et le calcul hautes performances (HPC).

Cette fonctionnalité ne nécessite généralement aucune modification du code de votre application. Vous n'avez besoin de configurer NCCL que pour utiliser le P2P. Pour configurer NCCL, avant d'exécuter vos charges de travail, définissez la variable d'environnement NCCL_P2P_LEVEL sur votre instance G4 en fonction du type de machine :

Pour les instances G4 avec 2 ou 4 GPU (g4-standard-96, g4-standard-192) : définissez NCCL_P2P_LEVEL=PHB
Pour les instances G4 avec huit GPU (g4-standard-384) : définissez NCCL_P2P_LEVEL=SYS.

Définissez la variable d'environnement à l'aide de l'une des options suivantes :

Sur la ligne de commande, exécutez la commande d'exportation appropriée (par exemple, export NCCL_P2P_LEVEL=SYS) dans la session shell où vous prévoyez d'exécuter votre application. Pour que ce paramètre soit conservé, ajoutez cette commande au script de démarrage de votre shell (par exemple, ~/.bashrc).
Ajoutez le paramètre approprié (par exemple, NCCL_P2P_LEVEL=SYS) au fichier de configuration NCCL situé à l'emplacement /etc/nccl.conf.

Principaux avantages et performances

Accélère les charges de travail multi-GPU sur les instances G4 avec deux GPU ou plus : offre des durées d'exécution plus rapides pour les applications s'exécutant sur les types de machines g4-standard-96, g4-standard-192 et g4-standard-384.
Fournit une communication à bande passante élevée : permet des vitesses de transfert de données élevées entre les GPU.
Amélioration des performances de NCCL : améliore considérablement les performances des applications qui utilisent la bibliothèque NVIDIA Collective Communication Library (NCCL) par rapport à la communication qui n'utilise pas le P2P. L'hyperviseur de Google isole de manière sécurisée cette communication P2P au sein de vos instances.
- Sur les instances à quatre GPU (g4-standard-192), tous les GPU se trouvent sur un seul nœud NUMA, ce qui permet une communication P2P plus efficace. Cela peut entraîner des améliorations des performances allant jusqu'à 2,04x pour les collectifs tels que Allgather, Allreduce et ReduceScatter.
- Sur huit instances de GPU (g4-standard-384), les GPU sont répartis sur deux nœuds NUMA. La communication P2P est accélérée pour le trafic à l'intérieur et entre ces nœuds, avec des améliorations de performances allant jusqu'à 2,19x pour les mêmes collectifs.

Série de machines G2

La série de machines G2 est disponible dans les types de machines standards comportant entre 4 et 96 processeurs virtuels et jusqu'à 432 Go de mémoire. Cette série de machines est optimisée pour les charges de travail d'inférence et graphiques. La série de machines G2 est disponible dans un seul type de machine standard avec plusieurs configurations.

Les instances créées à l'aide des types de machines G2 offrent les fonctionnalités suivantes :

Accélération GPU : chaque type de machine G2 dispose de GPU NVIDIA L4.
Amélioration des taux d'inférence : le type de machine G2 accepte le type de données FP8 (virgule flottante de 8 bits), ce qui accélère les taux d'inférence de ML et réduit les besoins en mémoire.
Performances graphiques de nouvelle génération : les GPU NVIDIA L4 associés offrent des performances graphiques jusqu'à trois fois supérieures en utilisant des cœurs RT de troisième génération et la technologie NVIDIA DLSS 3 (Deep Learning Super Sampling).
Bande passante réseau hautes performances : avec les types de machines G2, vous pouvez atteindre jusqu'à 100 Gbit/s de bande passante réseau.
Compatibilité avec les disques SSD locaux, les disques persistants et les hyperdisques : vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local aux instances G2. Cela peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.

Vous pouvez également associer des volumes Hyperdisk et Persistent Disk aux instances G2, pour les applications nécessitant un stockage plus persistant. La capacité de stockage maximale dépend du nombre de processeurs virtuels disponibles sur l'instance. Pour plus d'informations, consultez la page Types de disques compatibles.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos instances dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour les instances situées dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.

Types de machines G2

Les types de machines G2 optimisés pour les accélérateurs sont associés à des GPU NVIDIA L4 et sont idéaux pour les charges de travail d'inférence optimisées pour les coûts, les charges de travail de calcul hautes performances et celles nécessitant beaucoup de ressources graphiques.

Chaque type de machine G2 dispose également d'une mémoire par défaut et d'une plage de mémoire personnalisée. La plage de mémoire personnalisée définit la quantité de mémoire que vous pouvez allouer à votre instance pour chaque type de machine. Vous pouvez également ajouter des disques SSD locaux lorsque vous créez une instance G2. Pour connaître le nombre de disques que vous pouvez associer, consultez Types de machines nécessitant le choix d'un nombre de disques SSD locaux.

						GPU NVIDIA L4 associés
Type de machine	Nombre de vCPU¹	Mémoire d'instance par défaut (Go)	Plage de mémoire d'instance personnalisée (Go)	Disque SSD local maximal compatible (Gio)	Bande passante réseau maximale (Gbit/s)²	Nombre de GPU	Mémoire GPU³ (Go GDDR6)
`g2-standard-4`	4	16	Entre 16 et 32	375	10	1	24
`g2-standard-8`	8	32	Entre 32 et 54	375	16	1	24
`g2-standard-12`	12	48	Entre 48 et 54	375	16	1	24
`g2-standard-16`	16	64	Entre 54 et 64	375	32	1	24
`g2-standard-24`	24	96	Entre 96 et 108	750	32	2	48
`g2-standard-32`	32	128	Entre 96 et 128	375	32	1	24
`g2-standard-48`	48	192	Entre 192 et 216	1 500	50	4	96
`g2-standard-96`	96	384	Entre 384 et 432	3 000	100	8	192

Limites des machines G2

Vous ne pouvez demander de la capacité qu'en utilisant les options de consommation compatibles pour un type de machine G2.
Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les instances qui utilisent un type de machine G2.
Vous ne pouvez utiliser un type de machine G2 que dans certaines régions et zones.
Le type de machine G2 n'est disponible que sur la plate-forme Cascade Lake.
Les disques persistants standards (pd-standard) ne sont pas compatibles avec les instances qui utilisent le type de machine G2. Pour connaître les types de disques compatibles, consultez la section Types de disques compatibles pour G2.
Vous ne pouvez pas créer de GPU multi-instances sur une instance qui utilise un type de machine G2.
Si vous devez modifier le type de machine d'une instance G2, consultez la page Modifier des instances optimisées pour les accélérateurs.
Vous ne pouvez pas utiliser de Deep Learning VM Image en tant que disque de démarrage pour les instances utilisant le type de machine G2.
Le pilote par défaut actuel de Container-Optimized OS n'est pas compatible avec les GPU L4 s'exécutant sur des types de machines G2. De plus, Container-Optimized OS n'accepte qu'un ensemble sélectionné de pilotes. Si vous souhaitez utiliser Container-Optimized OS sur des types de machines G2, consultez les notes suivantes :
- Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version 525.60.13 recommandée (minimum) ou ultérieure. Pour en savoir plus, consultez les Notes de version de Container-Optimized OS.
- Lorsque vous installez le pilote, spécifiez la dernière version disponible compatible avec les GPU L4. Exemple :sudo cos-extensions install gpu -- -version=525.60.13
Vous devez utiliser Google Cloud CLI ou REST pour créer des instances G2 dans les scénarios suivants :
- Vous souhaitez spécifier des valeurs personnalisées de la mémoire.
- Vous souhaitez personnaliser le nombre de cœurs de processeur visibles.

Types de disques compatibles avec les instances G2

Les instances G2 peuvent utiliser les types de stockage de blocs suivants :

Disque persistant avec équilibrage (pd-balanced)
Disque persistant SSD (performances, pd-ssd)
Hyperdisk ML (hyperdisk-ml)
Débit hyperdisque (hyperdisk-throughput)
SSD local

Si le type de machine le permet, vous pouvez associer une combinaison de volumes Hyperdisk et Persistent Disk à une instance, mais les restrictions suivantes s'appliquent :

Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par instance.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
- Pour les types de machines avec moins de 32 vCPU:
  - 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
  - 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- Pour les types de machines comportant 32 vCPU ou plus:
  - 512 Tio pour tous les volumes Hyperdisk
  - 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
  - 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de taille et de nombre d'attachements Hyperdisk et Capacité maximale des disques persistants.

Famille de machines optimisées pour les accélérateurs

Séries de machines recommandées par type de charge de travail

Options de tarification et de consommation

Disponibilité des options d'utilisation par type de machine

Série de machines A4X

Type de machine A4X

Limites des machines A4X

Types de disques compatibles avec les instances A4X

Limites de disque et de capacité

Série de machines A4

Type de machine A4

Limites des machines A4

Types de disques compatibles avec les instances A4

Limites de disque et de capacité

Série de machines A3

Type de machine A3 Ultra

Limites des machines A3 Ultra

Type de machine A3 Mega

Limites des machines A3 Mega

Type de machine A3 High

Limites des machines A3 High

Type de machine A3 Edge

Limites des machines A3 Edge

Types de disques compatibles avec les instances A3

A3 Ultra

A3 Mega

A3 High

A3 Edge

Limites de disque et de capacité

Série de machines A2

Types de machines ultra A2

Limites des machines ultra A2

Types de machines A2 standards

Limites des types de machines A2 standards

Types de disques compatibles avec les instances A2

Série de machines G4

Types de machines G4

Limites des machines G4

Types de disques compatibles avec les instances G4

Communication peer-to-peer (P2P) G4

Principaux avantages et performances

Série de machines G2

Types de machines G2

Limites des machines G2

Types de disques compatibles avec les instances G2

Étapes suivantes