La famille de machines optimisées pour les accélérateurs est conçue par Google Cloud pour fournir les performances et l'efficacité nécessaires aux charges de travail accélérées par GPU, telles que l'intelligence artificielle (IA), le machine learning (ML) et le calcul hautes performances (HPC).
La famille de machines optimisées pour les accélérateurs est disponible dans les séries de machines A3, A2 et G2. Chaque type de machine d'une série est associé à un modèle spécifique et à un nombre de GPU NVIDIA. Vous pouvez également associer certains modèles de GPU à des types de machines à usage général N1.
Recommandation de séries de machines par type de charge de travail
La section suivante fournit la série de machines recommandée en fonction de vos charges de travail GPU.
Modèles d'IA volumineux
Type de charge de travail | Cas d'utilisation | Bonne alternative |
---|---|---|
Entraînement sur des serveurs multiples (distribué) | A3 Mega | A3 High, A2 |
Inférence | A3 High, A3 Edge | A2 |
Pour provisionner des clusters afin d'exécuter des modèles et des entraînements à grande échelle, consultez la section Exécuter des entraînements et des affinages de modèles à grande échelle.
Modèles traditionnels
Type de charge de travail | Cas d'utilisation | Bonne alternative (dans l'ordre recommandé) |
---|---|---|
Entraînement sur des serveurs multiples (distribué) | A3 Mega, A3 High |
|
Entraînement sur un seul serveur | A3 High, A3 Edge |
|
Inférence | A3 Edge, G2 |
|
Pour provisionner des clusters pour exécuter des modèles traditionnels, consultez la section Entraînement et affinage de modèles traditionnels.
Charges de travail exigeantes en ressources graphiques
Type de charge de travail | Meilleure solution (dans l'ordre recommandé) |
---|---|
Streaming vidéo et transcodage, postes de travail virtuels à distance, jumeaux numériques |
|
Pour provisionner des VM pour des charges de travail graphiques intensives, consultez ces options.
Calcul hautes performances
Pour les charges de travail de calcul hautes performances, toutes les séries de machines optimisées pour les accélérateurs fonctionnent bien. La machine la plus adaptée dépend de la quantité de calculs qui doit être déchargée sur le GPU.
Prix et remise
Tous les types de machines optimisés pour les accélérateurs sont compatibles avec les options de remise et de consommation suivantes :
Les types de machines optimisés pour les accélérateurs sont facturés pour les GPU, les processeurs virtuels prédéfinis, la mémoire et le disque SSD local (le cas échéant). Pour en savoir plus sur les tarifs des VM optimisées pour les accélérateurs, consultez la section Famille de types de machines optimisés pour les accélérateurs sur la page des tarifs de l'instance de VM.
Série de machines A3
La série de machines A3 dispose de 208 processeurs virtuels et de 1 872 Go de mémoire. Cette série de machines est optimisée pour l'entraînement ML lié au réseau, le calcul et la mémoire intensifs, et les charges de travail HPC.
La série de machines A3 fournit également les fonctionnalités suivantes :
Matériel nouvelle génération : chaque type de machine A3 est associé à des GPU NVIDIA H100 SXM, offre 80 Go de mémoire par GPU et est idéal pour les modèles de langage volumineux basés sur les transformateurs, les bases de données et le HPC.
Cette série de machines est basée sur le processeur évolutif Intel Xeon de 4e génération (Sapphire Rapids) et offre une fréquence turbo maximale à cœur unique soutenue pouvant atteindre 3,3 GHz.
Évolutivité NVLink de pointe : les GPU NVIDIA H100 fournissent une bande passante GPU NVLink maximale de 450 Go/s, de manière unidirectionnelle. Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s. Ces GPU peuvent être utilisés comme un accélérateur hautes performances unique doté d'un espace de mémoire unifié pour fournir jusqu'à 25 pétaflops de puissance de calcul AI/DL/ML et jusqu'à 50 pétaflops de puissance de calcul d'inférence.
Vitesse de calcul et mise en réseau améliorées: la série de machines A3 offre des vitesses de mise en réseau jusqu'à 2,5 fois supérieures à celles de la série de machines A2 de la génération précédente. Pour en savoir plus sur la mise en réseau, consultez la section Mise en réseau et série de machines A3.
Optimisations de la virtualisation : la topologie PCIe (Peripheral Component Interconnect Express) des VM A3 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.
Les GPU NVIDIA H100 exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.
Stockage: 6 000 Gio de disque SSD local sont automatiquement ajoutés aux VM créées à l'aide de l'un des types de machines A3. Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.
Vous pouvez également associer jusqu'à 257 Tio de stockage sur disque persistant aux types de machines de cette série pour les applications nécessitant des performances de stockage plus élevées.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité. La stratégie d'emplacement compact accepte jusqu'à 96 VM dans un sous-ensemble à faible latence du réseau, dans une zone donnée. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.
Les types de machines suivants sont disponibles pour la série de machines A3.
Type de machine A3 Mega
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ | Protocole réseau |
---|---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 9 | 1 800 | GPUDirect-TCPXO |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Type de machine A3 High
Lorsque vous provisionnez des types de machinesa3-highgpu-1g
, a3-highgpu-2g
ou a3-highgpu-4g
, vous devez utiliser des VM Spot ou une fonctionnalité qui utilise le planificateur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur l'une de ces options, consultez les ressources suivantes :
- Pour créer des VM Spot, consultez la page Créer une VM optimisée pour les accélérateurs et n'oubliez pas de définir le modèle de provisionnement sur
SPOT
. - Pour créer une requête de redimensionnement dans un MIG qui utilise le planificateur de charges de travail dynamique, consultez la section Créer un MIG avec des VM avec GPU.
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ | Protocole réseau |
---|---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 | GPUDirect-TCPX |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1 500 | 1 | 50 | GPUDirect-TCPX |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3 000 | 1 | 100 | GPUDirect-TCPX |
a3-highgpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 5 | 800 | GPUDirect-TCPX |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Type de machine A3 Edge
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Nombre de cartes d'interface réseau physiques | Bande passante réseau maximale (Gbit/s)‡ | Protocole réseau |
---|---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1 872 | 6 000 | 5 |
|
GPUDirect-TCPX |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Types de disques compatibles avec la série A3
Les VM A3 peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Hyperdisk équilibré (
hyperdisk-balanced
): Hyperdisk équilibré n'est compatible qu'avec les types de machinesa3-megagpu-8g
,a3-highgpu-8g
eta3-edgegpu-8g
. - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisque extrême (
hyperdisk-extreme
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local : ajouté automatiquement aux VM créées à l'aide du type de machine A3
A3 Mega
Nombre maximal de disques par VM* | ||||||
---|---|---|---|---|---|---|
Types de machines |
Tous les disques† | Volume Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | Disques SSD locaux associés |
a3-megagpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 High
Nombre maximal de disques par VM* | ||||||
---|---|---|---|---|---|---|
Types de machines |
Tous les disques† | Volume Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | Disques SSD locaux associés |
a3-highgpu-1g |
128 | N/A | 64 | 64 | N/A | 2 |
a3-highgpu-2g |
128 | N/A | 64 | 64 | N/A | 4 |
a3-highgpu-4g |
128 | N/A | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 Edge
Nombre maximal de disques par VM* | ||||||
---|---|---|---|---|---|---|
Types de machine | Tous les disques† | Volume Hyperdisk équilibré | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | SSD local associé |
a3-edgegpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques Persistent Disk et Hyperdisk.
†Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.
Limites de disque et de capacité
Vous pouvez utiliser une combinaison de volumes Persistent Disk et Hyperdisk avec une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU :
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus :
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.
Mise en réseau et série de machines A3
La série de machines A3 offre une vitesse de calcul jusqu'à 2,5 fois supérieure à celle de la série de machines A2. Le type de machine a3-highgpu-8g
offre une bande passante réseau 10 fois supérieure à celle des types de machines A2 de la génération précédente.
Le type de machine a3-megagpu-8g
offre une bande passante réseau deux fois supérieure à celle de a3-highgpu-8g
et 20 fois supérieure à celle des types de machines A2.
- VM A3 avec une seule carte d'interface réseau: pour les VM A3 associées à 1 à 4 GPU, une seule carte d'interface réseau (NIC) physique est disponible.
- VM A3 à plusieurs cartes d'interface réseau: pour les VM A3 avec huit GPU associés, plusieurs cartes d'interface réseau physiques sont disponibles. Pour ces types de machines A3, les NIC sont organisées comme suit sur un bus Peripheral Component Interconnect Express (PCIe) :
- Pour le type de machine A3 Mega : une configuration de carte d'interface réseau de 8+1 est disponible. Avec cet agencement, huit cartes d'interface réseau partagent le même bus PCIe et une carte d'interface réseau réside sur un bus PCIe distinct.
- Pour le type de machine A3 High : une configuration de carte d'interface réseau de 4+1 est disponible. Avec cet agencement, quatre cartes d'interface réseau partagent le même bus PCIe et une carte d'interface réseau réside sur un bus PCIe distinct.
- Pour le type de machine A3 Edge: une configuration de carte d'interface réseau de 4+1 est disponible. Avec cet agencement, quatre cartes d'interface réseau partagent le même bus PCIe et une carte d'interface réseau réside sur un bus PCIe distinct. Ces cinq cartes réseau fournissent une bande passante réseau totale de 400 Gbit/s pour chaque VM.
Les cartes d'interface réseau qui partagent le même bus PCIe ont un alignement non uniforme d'accès à la mémoire (NUMA) d'une carte d'interface réseau pour deux GPU NVIDIA H100 80 Go. Ces cartes réseau sont idéales pour la communication entre GPU à bande passante élevée. La carte réseau physique qui réside sur un bus PCIe distinct est idéale pour d'autres besoins de mise en réseau.
Protocoles de réseau
La série de machines A3 offre des performances de cluster de GPU améliorées avec GPUDirect-TCPX et GPUDirect-TCPXO.
- Pour les types de machines A3 Edge et A3 High, GPUDirect-TCPX augmente les performances réseau en autorisant le transfert de charges utiles de paquets de données directement de la mémoire GPU vers l'interface réseau. En exploitant GPUDirect-TCPX, le type de machine
a3-highgpu-8g
offre un débit beaucoup plus élevé entre les VM d'un cluster par rapport aux types de machines A2 ou G2 optimisés pour les accélérateurs. - Pour les types de machines A3 Mega, GPUDirect-TCPXO améliore encore GPUDirect-TCPX en transférant le traitement du protocole TCP vers les cœurs ACC du SmartNIC. En exploitant GPUDirect-TCPXO, le type de machine
a3-megagpu-8g
double la bande passante réseau par rapport au type de machinea3-highgpu-8g
.
Limites de la série A3
Les limites suivantes s'appliquent aux VM qui utilisent les types de machines A3 Edge, A3 High et A3 Mega:
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent les types de machines A3.
- Vous ne pouvez utiliser des types de machines A3 que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disques persistants régionaux sur des VM utilisant des types de machines A3.
- La série de machines A3 n'est disponible que sur la plate-forme Sapphire Rapids.
- Si votre VM utilise un type de machine A3, vous ne pouvez pas modifier le type de machine. Si vous avez besoin de modifier le type de machine, vous devez créer une nouvelle VM.
- Vous ne pouvez pas modifier le type de machine d'une VM en type de machine A3. Si vous avez besoin d'une VM qui utilise un type de machine A3, vous devez créer une nouvelle VM.
- Les types de machines A3 ne sont pas compatibles avec la location unique.
- Vous ne pouvez pas exécuter des systèmes d'exploitation Windows sur les types de machines A3.
- Vous ne pouvez réserver des types de machines A3 que via certaines réservations.
- Pour les types de machine
a3-highgpu-1g
,a3-highgpu-2g
eta3-highgpu-4g
, les limites suivantes s'appliquent :-
Pour ces types de machines, vous devez utiliser des VM Spot ou une fonctionnalité qui utilise le planificateur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur l'une de ces options, consultez les ressources suivantes :
- Pour créer des VM Spot, consultez la page Créer une VM optimisée pour les accélérateurs et n'oubliez pas de définir le modèle de provisionnement sur
SPOT
. - Pour créer une requête de redimensionnement dans un MIG qui utilise le planificateur de charges de travail dynamique, consultez Créer un MIG avec des VM avec GPU.
- Pour créer des VM Spot, consultez la page Créer une VM optimisée pour les accélérateurs et n'oubliez pas de définir le modèle de provisionnement sur
- Vous ne pouvez pas utiliser Hyperdisk équilibré avec ces types de machines.
- Vous ne pouvez pas créer de réservations.
-
Pour ces types de machines, vous devez utiliser des VM Spot ou une fonctionnalité qui utilise le planificateur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur l'une de ces options, consultez les ressources suivantes :
Série de machines A2
La série de machines A2 est disponible dans les types de machines A2 standard et A2 ultra. Ces types de machines disposent de 12 à 96 processeurs virtuels et de 1 360 Go de mémoire.
La série de machines A2 fournit également les fonctionnalités suivantes :
GPU NVIDIA associés : chaque type de machine A2 dispose de GPU NVIDIA A100. Elles sont disponibles dans les options A100 40 Go et A100 80 Go.
Évolutivité NVLink de pointe qui fournit un pic de bande passante GPU à GPU NVLink de 600 Gbit/s. Par exemple, les systèmes avec 16 GPU disposent d'une bande passante globale NVLink pouvant atteindre 9,6 To. Ces 16 GPU peuvent être utilisés comme accélérateur hautes performances unique équipé d'un espace de mémoire unifié pour fournir jusqu'à 10 pétaflops de puissance de calcul et jusqu'à 20 pétaflops de puissance de calcul d'inférence pouvant servir pour l'intelligence artificielle, ainsi que les charges de travail de deep learning et de machine learning.
Vitesse de calcul améliorée : les GPU NVIDIA A100 associées offrent une vitesse de calcul jusqu'à 10 fois supérieure à celle des GPU NVIDIA V100 de la génération précédente.
Avec la série de machines A2, vous pouvez obtenir jusqu'à 100 Gbit/s de bande passante réseau.
Stockage : pour les espaces de travail rapides ou pour alimenter les GPU en données, tout en évitant les goulots d'étranglement d'E/S, les types de machines A2 sont compatibles avec les disques SSD locaux comme suit :
- Pour les types de machines A2 standards, vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local.
- Pour les types de machines ultra A2, le disque SSD local est automatiquement associé lors de la création de la VM.
Vous pouvez également associer jusqu'à 257 Tio de stockage sur disque persistant aux VM A2 pour les applications nécessitant ces performances de stockage plus élevées.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.
Types de disques compatibles avec A2
Les VM A2 peuvent utiliser les types de stockage de blocs suivants :
- Hyperdisk ML (
hyperdisk-ml
) - Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Disque persistant standard (
pd-standard
) - Disque SSD local : il est automatiquement associé aux VM créées à l'aide des types de machines ultra A2.
Vous pouvez utiliser une combinaison de volumes Persistent Disk et Hyperdisk avec une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU :
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus :
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.
Types de machines ultra A2
Ces types de machines ont un nombre fixe de GPU A100 80 Go. Le disque SSD local est automatiquement associé à des VM créées à l'aide des types de machines ultra A2.
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1 500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1 360 | 3 000 | 100 |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines ultra A2
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent les types de machines A2 Ultra.
- Vous ne pouvez utiliser des types de machines A2 Ultra que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disques persistants régionaux sur des VM utilisant des types de machines A2 Ultra.
- Les types de machines A2 Ultra ne sont disponibles que sur la plate-forme Cascade Lake.
- Si votre VM utilise un type de machine A2 Ultra, vous ne pouvez pas modifier le type de machine. Si vous devez utiliser un autre type de machine A2 Ultra ou toute autre famille de machines, vous devez créer une VM.
- Vous ne pouvez pas remplacer un autre type de machine par un type de machine A2 Ultra. Si vous avez besoin d'une VM utilisant un type de machine A2 Ultra, vous devez créer une nouvelle VM.
- Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Ultra. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant
format fs=ntfs label=tmpfs
.
Types de machines A2 standards
Ces types de machines ont un nombre fixe de GPU A100 40 Go.
Type de machine | Nombre de GPU | Mémoire GPU* (GB HBM3) |
Nombre de vCPU† | Mémoire VM (Go) | SSD local associé (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | Oui | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | Oui | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | Oui | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | Oui | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1 360 | Oui | 100 |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des types de machines A2 standards
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent les types de machines A2 Standard.
- Vous ne pouvez utiliser des types de machines A2 Standard que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disques persistants régionaux sur des VM utilisant des types de machines A2 Standard.
- Les types de machines A2 Standard ne sont disponibles que sur la plate-forme Cascade Lake.
- Si votre VM utilise un type de machine A2 Standard, vous ne pouvez passer d'un type de machine A2 Standard qu'à un autre type de machine A2 Standard. Vous ne pouvez pas passer à un autre type de machine. Pour en savoir plus, consultez la page Modifier des VM optimisées pour les accélérateurs.
- Vous ne pouvez pas utiliser le système d'exploitation Windows avec les types de machines A2 Standard <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Lorsque vous utilisez des systèmes d'exploitation Windows, choisissez un autre type de machine A2 Standard.</codea2-megagpu-16g<>
- Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Standard. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant
format fs=ntfs label=tmpfs
. - Les types de machines A2 Standard ne sont pas compatibles avec la location unique.
Série de machines G2
La série de machines G2 est disponible dans les types de machines standards comportant entre 4 et 96 processeurs virtuels et jusqu'à 432 Go de mémoire. Cette série de machines est optimisée pour les charges de travail d'inférence et graphiques.
La série de machines G2 fournit également les fonctionnalités suivantes :
GPU NVIDIA associés : chaque type de machine G2 dispose de GPU NVIDIA L4.
Amélioration des taux d'inférence : les types de machines G2 acceptent le type de données FP8 (virgule flottante de 8 bits), ce qui accélère les taux d'inférence de ML et réduit les besoins en mémoire.
Performances graphiques de nouvelle génération : les GPU NVIDIA L4 offrent des performances graphiques jusqu'à trois fois supérieures en utilisant des cœurs RT de troisième génération et la technologie NVIDIA DLSS 3 (Deep Learning Super Sampling).
Bande passante réseau hautes performances : avec la série de machines G2, vous pouvez atteindre jusqu'à 100 Gbit/s de bande passante réseau.
Stockage: vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local aux VM G2. Cela peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.
Vous pouvez également associer des volumes Hyperdisk et Persistent Disk aux VM G2, pour les applications nécessitant un stockage plus persistant. La capacité de stockage maximale dépend du nombre de processeurs virtuels disponibles sur la VM. Pour plus d'informations, consultez la page Types de disques compatibles.
Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.
Types de disques compatibles pour G2
Les VM G2 peuvent utiliser les types de stockage de blocs suivants :
- Disque persistant avec équilibrage (
pd-balanced
) - Disque persistant SSD (performances,
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Débit hyperdisque (
hyperdisk-throughput
) - SSD local
Vous pouvez utiliser une combinaison de volumes Persistent Disk et Hyperdisk avec une VM, mais les restrictions suivantes s'appliquent :
- Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :
Pour les types de machines avec moins de 32 vCPU :
- 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
- 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
Pour les types de machines comportant 32 vCPU ou plus :
- 512 Tio pour tous les volumes Hyperdisk
- 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
- 257 Tio pour tous les volumes Persistent Disk
Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.
Types de machines G2
Chaque type de machine G2 est associé à un nombre fixe de GPU NVIDIA L4 et de processeurs virtuels. Chaque type de machine G2 dispose également d'une mémoire par défaut et d'une plage de mémoire personnalisée. La plage de mémoire personnalisée définit la quantité de mémoire que vous pouvez allouer à votre VM pour chaque type de machine. Vous pouvez spécifier votre mémoire personnalisée lors de la création de la VM.
Type de machine | Nombre de GPU | Mémoire GPU* (Go GDDR6) | Nombre de vCPU† | Mémoire VM par défaut (Go) | Plage de mémoire personnalisée VM (Go) | Disque SSD local maximal compatible (Gio) | Bande passante réseau maximale (Gbit/s)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | Entre 16 et 32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | Entre 32 et 54 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | Entre 48 et 54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | Entre 54 et 64 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | Entre 96 et 108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | Entre 96 et 128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | Entre 192 et 216 | 1 500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | Entre 384 et 432 | 3 000 | 100 |
*La mémoire du GPU est la mémoire d'un appareil GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
†Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
‡ La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs.
Consultez la page Bande passante réseau.
Limites des machines G2
- Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexibles pour les VM qui utilisent les types de machines G2.
- Vous ne pouvez utiliser des types de machines G2 que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disques persistants régionaux sur des VM utilisant des types de machines G2.
- Le type de machine G2 n'est disponible que sur la plate-forme Cascade Lake.
- Les disques persistants standards (
pd-standard
) ne sont pas compatibles avec les VM qui utilisent des types de machines standards G2. Pour connaître les types de disques compatibles, consultez la section Types de disques compatibles pour G2. - Vous ne pouvez pas créer de GPU multi-instances sur des types de machines G2.
- Si vous devez modifier le type de machine d'une VM G2, consultez la page Modifier des VM optimisées pour les accélérateurs.
- Vous ne pouvez pas utiliser de Deep Learning VM Image en tant que disque de démarrage pour vos VM utilisant des types de machines G2.
- Le pilote par défaut actuel de Container-Optimized OS n'est pas compatible avec les GPU L4 s'exécutant sur des types de machines G2. Container-Optimized OS n'accepte également qu'un ensemble sélectionné de pilotes.
Si vous souhaitez utiliser Container-Optimized OS sur des types de machines G2, consultez les notes suivantes :
- Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version
525.60.13
recommandée (minimum) ou ultérieure. Pour en savoir plus, consultez les Notes de version de Container-Optimized OS. - Lorsque vous installez le pilote, spécifiez la dernière version disponible compatible avec les GPU L4.
Par exemple,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version
- Vous devez utiliser Google Cloud CLI ou REST pour créer des VM G2 dans les scénarios suivants :
- Vous souhaitez spécifier des valeurs personnalisées de la mémoire.
- Vous souhaitez personnaliser le nombre de cœurs de processeur visibles.