Famille de machines optimisées pour les accélérateurs


La famille de machines optimisées pour les accélérateurs est conçue par Google Cloud pour fournir les performances et l'efficacité nécessaires aux charges de travail accélérées par GPU, telles que l'intelligence artificielle (IA), le machine learning (ML) et le calcul hautes performances (HPC).

La famille de machines optimisées pour les accélérateurs est disponible dans les séries de machines A3, A2 et G2. Chaque type de machine d'une série est associé à un modèle spécifique et à un nombre de GPU NVIDIA. Vous pouvez également associer certains modèles de GPU à des types de machines à usage général N1.

Recommandation de séries de machines par type de charge de travail

La section suivante fournit la série de machines recommandée en fonction de vos charges de travail GPU.

Type de charge de travail Type ou série de machine recommandés
Modèles de pré-entraînement A3 Ultra, A3 Mega, A3 High, A2

Pour identifier la meilleure option, consultez les recommandations pour le pré-entraînement des modèles dans la documentation de l'hypercalculateur d'IA.

Affinage des modèles A3 Mega, A3 High, A2 

Pour identifier le modèle le mieux adapté, consultez les recommandations pour affiner les modèles dans la documentation de l'hypercalculateur d'IA.

Inférence de diffusion A3 Ultra, A3 Mega, A3 High, A2

Pour identifier la solution la plus adaptée, consultez les recommandations pour l'inférence dans la documentation de l'hypercalculateur d'IA.

Charges de travail exigeantes en ressources graphiques G2, N1+T4
Calcul hautes performances Pour les charges de travail de calcul hautes performances, toutes les séries de machines optimisées pour les accélérateurs fonctionnent bien. La machine la plus adaptée dépend de la quantité de calculs qui doit être déchargée sur le GPU.

Pour en savoir plus, consultez les recommandations pour l'HPC dans la documentation de l'hypercalculateur d'IA.

Prix et remise

Tous les types de machines optimisés pour les accélérateurs sont compatibles avec les options de remise et de consommation suivantes :

Les types de machines optimisés pour les accélérateurs sont facturés pour les GPU, les processeurs virtuels prédéfinis, la mémoire et le disque SSD local (le cas échéant). Pour en savoir plus sur les tarifs des VM optimisées pour les accélérateurs, consultez la section Famille de types de machines optimisés pour les accélérateurs sur la page des tarifs de l'instance de VM.

Série de machines A3

La série de machines A3 dispose de jusqu'à 224 processeurs virtuels et de 2 944 Go de mémoire. Cette série de machines est optimisée pour l'entraînement ML lié au réseau, le calcul et la mémoire intensifs, et les charges de travail HPC.

La série de machines A3 fournit également les fonctionnalités suivantes :

Fonctionnalité A3 Ultra A3 Mega, High, Edge
GPU connectés

GPU NVIDIA H200 SXM, qui offrent 141 Go de mémoire GPU par GPU et fournissent une mémoire plus importante et plus rapide pour prendre en charge les grands modèles de langage et les charges de travail HPC.

GPU NVIDIA H100 SXM, qui offrent 80 Go de mémoire par GPU et sont idéaux pour les modèles de langage volumineux basés sur les transformateurs, les bases de données et le HPC.

Plate-forme du processeur

Le processeur Intel Xeon Scalable de 5e génération (Emerald Rapids) offre une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 4 GHz. Pour en savoir plus sur ce processeur, consultez la page Plate-forme de processeur.

Le processeur Intel Xeon Scalable de 4e génération (Sapphire Rapids) offre une fréquence turbo maximale à cœur unique soutenue allant jusqu'à 3,3 GHz. Pour en savoir plus sur ce processeur, consultez la page Plate-forme de processeur.

Évolutivité NVLink de pointe

Les GPU NVIDIA H200 fournissent une bande passante GPU NVLink maximale de 900 Go/s, de manière unidirectionnelle.

Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s.

Les GPU NVIDIA H100 fournissent une bande passante NVLink GPU maximale de 450 Go/s, de manière unidirectionnelle.

Avec une topologie globale NVLink répartie sur huit GPU dans un même système, la bande passante globale NVLink peut atteindre 7,2 To/s.

Protocoles de réseau Pour ce type de machine, RDMA over Converged Ethernet (RoCE) améliore les performances réseau en combinant des cartes d'interface réseau (NIC) NVIDIA ConnectX-7 avec notre réseau à quatre voies aligné sur les rails à l'échelle du centre de données. En exploitant RDMA sur Ethernet convergent (RoCE), le type de machine a3-ultragpu-8g offre un débit beaucoup plus élevé entre les VM d'un cluster par rapport aux autres types de machines A3 optimisés pour les accélérateurs.
  • Pour les types de machines A3 Mega, GPUDirect-TCPXO améliore encore GPUDirect-TCPX en déchargeant le protocole TCP. En exploitant GPUDirect-TCPXO, le type de machine a3-megagpu-8g double la bande passante réseau par rapport aux types de machines A3 High et A3 Edge.
  • Pour les types de machines A3 Edge et A3 High, GPUDirect-TCPX améliore les performances réseau en autorisant le transfert de charges utiles de paquets de données directement de la mémoire GPU vers l'interface réseau. En exploitant GPUDirect-TCPX, ces types de machines offrent un débit beaucoup plus élevé entre les VM d'un cluster par rapport aux types de machines A2 ou G2 optimisés pour les accélérateurs.
Amélioration de la vitesse de calcul et de la mise en réseau

Offre des vitesses réseau jusqu'à quatre fois supérieures à celles de la série de machines A2 de la génération précédente.

Pour en savoir plus sur la mise en réseau, consultez la section Bandes passantes réseau et GPU.

Offre des vitesses réseau jusqu'à 2,5 fois supérieures à celles de la série de machines A2 de la génération précédente.

Pour en savoir plus sur la mise en réseau, consultez la section Bandes passantes réseau et GPU.

Optimisations de la virtualisation

La topologie PCIe (Peripheral Component Interconnect Express) des VM A3 fournit des informations de localité plus précises que les charges de travail peuvent utiliser pour optimiser les transferts de données.

Les GPU exposent également la réinitialisation au niveau de la fonction (FLR) pour une récupération concertée des défaillances et la prise en charge des opérations atomiques pour améliorer la concurrence dans certains scénarios.

Stockage

Un disque SSD local peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S. Le disque SSD local est associé comme suit:

  • 12 000 Gio de SSD local sont automatiquement ajoutés aux VM A3 Ultra.
  • 6 000 Gio de SSD local sont automatiquement ajoutés aux VM A3 Mega, High et Edge.

Vous pouvez également associer jusqu'à 512 Tio de stockage sur disque persistant et Hyperdisk aux types de machines de ces séries pour les applications nécessitant des performances de stockage plus élevées.

Prise en charge des stratégies d'emplacement compact

Vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données.

Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité.

Pour en savoir plus, consultez la section À propos des stratégies d'emplacement compact.

Les types de machines suivants sont disponibles pour la série de machines A3.

Type de machine A3 Ultra

Type de machine Nombre de GPU Mémoire GPU*
(Go HBM3e)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Nombre de cartes d'interface réseau physiques Bande passante réseau maximale (Gbit/s)
a3-ultragpu-8g 8 1128 224 2 952 12 000 10 3 600

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines ultra A3

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A3 Ultra.
  • Vous ne pouvez utiliser un type de machine A3 Ultra que dans certaines régions et zones.
  • Vous ne pouvez pas utiliser de disques persistants (régionaux ou zonaux) sur une VM utilisant un type de machine A3 Ultra.
  • Le type de machine A3 Ultra n'est disponible que sur la plate-forme de processeur Emerald Rapids.
  • Si votre VM utilise un type de machine A3 Ultra, vous ne pouvez pas modifier le type de machine. Si vous avez besoin de modifier le type de machine, vous devez créer une nouvelle VM.
  • Vous ne pouvez pas modifier le type de machine d'une VM en type de machine A3 Ultra. Si vous avez besoin d'une VM utilisant un type de machine A3 Ultra, vous devez créer une nouvelle VM.
  • Les types de machines A3 Ultra ne sont pas compatibles avec la location unique.
  • Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Ultra.
  • Vous ne pouvez réserver de la capacité qu'à l'aide d'un cluster Hypercompute.

Type de machine A3 Mega

Type de machine Nombre de GPU Mémoire GPU*
(GB HBM3)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Nombre de cartes d'interface réseau physiques Bande passante réseau maximale (Gbit/s)
a3-megagpu-8g 8 640 208 1 872 6 000 9 1 800

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines A3 Mega

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A3 Mega.
  • Vous ne pouvez utiliser un type de machine A3 Mega que dans certaines régions et zones.
  • Vous ne pouvez pas utiliser de disques persistants régionaux sur une VM utilisant le type de machine A3 Mega.
  • Le type de machine A3 Mega n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
  • Si votre VM utilise un type de machine A3 Mega, vous ne pouvez pas modifier le type de machine. Si vous avez besoin de modifier le type de machine, vous devez créer une nouvelle VM.
  • Vous ne pouvez pas modifier le type de machine d'une VM en type de machine A3 Mega. Si vous avez besoin d'une VM qui utilise un type de machine A3 Mega, vous devez créer une nouvelle VM.
  • Les types de machines A3 Mega ne sont pas compatibles avec la location unique.
  • Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Mega.

Type de machine A3 High

Type de machine Nombre de GPU Mémoire GPU*
(GB HBM3)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Nombre de cartes d'interface réseau physiques Bande passante réseau maximale (Gbit/s)
a3-highgpu-1g 1 80 26 234 750 1 25
a3-highgpu-2g 2 160 52 468 1 500 1 50
a3-highgpu-4g 4 320 104 936 3 000 1 100
a3-highgpu-8g 8 640 208 1 872 6 000 5 1 000

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines A3 hautes

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A3 High.
  • Vous ne pouvez utiliser un type de machine A3 High que dans certaines régions et zones.
  • Vous ne pouvez pas utiliser de disques persistants régionaux sur une VM utilisant un type de machine A3 High.
  • Le type de machine A3 High n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
  • Si votre VM utilise un type de machine A3 High, vous ne pouvez pas modifier le type de machine. Si vous avez besoin de modifier le type de machine, vous devez créer une nouvelle VM.
  • Vous ne pouvez pas modifier le type de machine d'une VM en type de machine A3 High. Si vous avez besoin d'une VM qui utilise un type de machine A3 High, vous devez créer une nouvelle VM.
  • Les types de machines A3 High ne sont pas compatibles avec la location unique.
  • Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 High.
  • Pour les types de machine a3-highgpu-1g, a3-highgpu-2g et a3-highgpu-4g, les limites suivantes s'appliquent :
    • Pour ces types de machines, vous devez utiliser des VM Spot ou une fonctionnalité qui utilise le planificateur de charge de travail dynamique (DWS), comme les requêtes de redimensionnement dans un MIG. Pour obtenir des instructions détaillées sur l'une de ces options, consultez les ressources suivantes :
    • Vous ne pouvez pas utiliser Hyperdisk équilibré avec ces types de machines.
    • Vous ne pouvez pas créer de réservations.
    Si vous essayez de créer une VM à l'aide du provisionnement standard ou de créer une réservation pour ces types de machines, vous recevrez un message d'erreur.

Type de machine A3 Edge

Type de machine Nombre de GPU Mémoire GPU*
(GB HBM3)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Nombre de cartes d'interface réseau physiques Bande passante réseau maximale (Gbit/s)
a3-edgegpu-8g 8 640 208 1 872 6 000 5
  • 800: pour asia-south1 et northamerica-northeast2
  • 400: pour toutes les autres régions A3 Edge

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines A3 Edge

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A3 Edge.
  • Vous ne pouvez utiliser un type de machine A3 Edge que dans certaines régions et zones.
  • Vous ne pouvez pas utiliser de disques persistants régionaux sur une VM utilisant le type de machine A3 Edge.
  • Le type de machine A3 Edge n'est disponible que sur la plate-forme de processeur Sapphire Rapids.
  • Si votre VM utilise un type de machine A3 Edge, vous ne pouvez pas modifier le type de machine. Si vous avez besoin de modifier le type de machine, vous devez créer une nouvelle VM.
  • Vous ne pouvez pas modifier le type de machine d'une VM en type de machine A3 Edge. Si vous avez besoin d'une VM qui utilise un type de machine A3 Edge, vous devez créer une nouvelle VM.
  • Les types de machines A3 Edge ne sont pas compatibles avec la location unique.
  • Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Edge.

Types de disques compatibles avec la série A3

A3 Ultra

Les VM A3 Ultra peuvent utiliser les types de stockage de blocs suivants:

  • Hyperdisk équilibré (hyperdisk-balanced): il s'agit du seul type de disque compatible avec le disque de démarrage.
  • Hyperdisque extrême (hyperdisk-extreme)
  • SSD local: ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM*
Types de machines
Tous les disques Volume Hyperdisk équilibré Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme Disques
SSD locaux
associés
a3-ultragpu-8g 128 128 N/A N/A 8 32

* L'utilisation des hyperdisques est facturée séparément du tarif par type de machine. Pour en savoir plus sur les tarifs des disques, consultez la page Tarifs d'Hyperdisk.
 Cette limite s'applique à Hyperdisk, mais n'inclut pas les disques SSD locaux.

A3 Mega

Les VM A3 Mega peuvent utiliser les types de stockage de blocs suivants:

  • Disque persistant avec équilibrage (pd-balanced)
  • Disque persistant SSD (performances, pd-ssd)
  • Volume Hyperdisk équilibré (hyperdisk-balanced)
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisque extrême (hyperdisk-extreme)
  • Débit hyperdisque (hyperdisk-throughput)
  • SSD local: ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM*
Types de machines
Tous les disques Volume Hyperdisk équilibré Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme Disques
SSD locaux
associés
a3-megagpu-8g 128 32 64 64 8 16

* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques Persistent Disk et Hyperdisk.
Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.

A3 High

Les VM A3 High peuvent utiliser les types de stockage de blocs suivants:

  • Disque persistant avec équilibrage (pd-balanced)
  • Disque persistant SSD (performances, pd-ssd)
  • Hyperdisk équilibré (hyperdisk-balanced): uniquement compatible avec a3-highgpu-8g
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisque extrême (hyperdisk-extreme)
  • Débit hyperdisque (hyperdisk-throughput)
  • SSD local: ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM*
Types de machines
Tous les disques Volume Hyperdisk équilibré Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme Disques
SSD locaux
associés
a3-highgpu-1g 128 N/A 64 64 N/A 2
a3-highgpu-2g 128 N/A 64 64 N/A 4
a3-highgpu-4g 128 N/A 64 64 8 8
a3-highgpu-8g 128 32 64 64 8 16

* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques Persistent Disk et Hyperdisk.
Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.

A3 Edge

Les VM A3 Edge peuvent utiliser les types de stockage de blocs suivants:

  • Disque persistant avec équilibrage (pd-balanced)
  • Disque persistant SSD (performances, pd-ssd)
  • Volume Hyperdisk équilibré (hyperdisk-balanced)
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisque extrême (hyperdisk-extreme)
  • Débit hyperdisque (hyperdisk-throughput)
  • SSD local: ajouté automatiquement aux VM créées à l'aide de l'un des types de machines A3
Nombre maximal de disques par VM*
Types de machine Tous les disques Volume Hyperdisk équilibré Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme SSD local associé
a3-edgegpu-8g 128 32 64 64 8 16

* L'utilisation des disques Hyperdisk et Persistent Disk est facturée séparément du tarif par type de machine. Pour connaître les tarifs des disques, consultez la section Tarifs des disques Persistent Disk et Hyperdisk.
Cette limite s'applique aux volumes Persistent Disk et Hyperdisk, mais n'inclut pas les disques SSD locaux.

Limites de disque et de capacité

Si le type de machine est compatible, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent:

  • Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
  • La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :

    • Pour les types de machines avec moins de 32 vCPU:

      • 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
      • 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
    • Pour les types de machines comportant 32 vCPU ou plus:

      • 512 Tio pour tous les volumes Hyperdisk
      • 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
      • 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.

Série de machines A2

La série de machines A2 est disponible dans les types de machines A2 standard et A2 ultra. Ces types de machines disposent de 12 à 96 processeurs virtuels et de 1 360 Go de mémoire.

La série de machines A2 fournit également les fonctionnalités suivantes :

  • GPU NVIDIA associés : chaque type de machine A2 dispose de GPU NVIDIA A100. Elles sont disponibles dans les options A100 40 Go et A100 80 Go.

  • Évolutivité NVLink de pointe qui fournit un pic de bande passante GPU à GPU NVLink de 600 Gbit/s. Par exemple, les systèmes avec 16 GPU disposent d'une bande passante globale NVLink pouvant atteindre 9,6 To. Ces 16 GPU peuvent être utilisés comme accélérateur hautes performances unique équipé d'un espace de mémoire unifié pour fournir jusqu'à 10 pétaflops de puissance de calcul et jusqu'à 20 pétaflops de puissance de calcul d'inférence pouvant servir pour l'intelligence artificielle, ainsi que les charges de travail de deep learning et de machine learning.

  • Vitesse de calcul améliorée : les GPU NVIDIA A100 associées offrent une vitesse de calcul jusqu'à 10 fois supérieure à celle des GPU NVIDIA V100 de la génération précédente.

    Avec la série de machines A2, vous pouvez obtenir jusqu'à 100 Gbit/s de bande passante réseau.

  • Stockage : pour les espaces de travail rapides ou pour alimenter les GPU en données, tout en évitant les goulots d'étranglement d'E/S, les types de machines A2 sont compatibles avec les disques SSD locaux comme suit :

    • Pour les types de machines A2 standards, vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local.
    • Pour les types de machines ultra A2, le disque SSD local est automatiquement associé lors de la création de la VM.

    Vous pouvez également associer jusqu'à 257 Tio de stockage sur disque persistant aux VM A2 pour les applications nécessitant ces performances de stockage plus élevées.

  • Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.

Types de machines ultra A2

Ces types de machines ont un nombre fixe de GPU A100 80 Go. Le disque SSD local est automatiquement associé à des VM créées à l'aide des types de machines ultra A2.

Type de machine Nombre de GPU Mémoire GPU*
(GB HBM3)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Bande passante réseau maximale (Gbit/s)
a2-ultragpu-1g 1 80 12 170 375 24
a2-ultragpu-2g 2 160 24 340 750 32
a2-ultragpu-4g 4 320 48 680 1 500 50
a2-ultragpu-8g 8 640 96 1 360 3 000 100

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines ultra A2

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A2 Ultra.
  • Vous ne pouvez utiliser des types de machines A2 Ultra que dans certaines régions et zones.
  • Les types de machines A2 Ultra ne sont disponibles que sur la plate-forme Cascade Lake.
  • Si votre VM utilise un type de machine A2 Ultra, vous ne pouvez pas modifier le type de machine. Si vous devez utiliser un autre type de machine A2 Ultra ou toute autre famille de machines, vous devez créer une VM.
  • Vous ne pouvez pas remplacer un autre type de machine par un type de machine A2 Ultra. Si vous avez besoin d'une VM utilisant un type de machine A2 Ultra, vous devez créer une nouvelle VM.
  • Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Ultra. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant format fs=ntfs label=tmpfs.

Types de machines A2 standards

Ces types de machines ont un nombre fixe de GPU A100 40 Go.

Type de machine Nombre de GPU Mémoire GPU*
(GB HBM3)
Nombre de vCPU Mémoire VM (Go) SSD local associé (Gio) Bande passante réseau maximale (Gbit/s)
a2-highgpu-1g 1 40 12 85 Oui 24
a2-highgpu-2g 2 80 24 170 Oui 32
a2-highgpu-4g 4 160 48 340 Oui 50
a2-highgpu-8g 8 320 96 680 Oui 100
a2-megagpu-16g 16 640 96 1 360 Oui 100

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des types de machines A2 standards

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine A2 Standard.
  • Vous ne pouvez utiliser des types de machines A2 Standard que dans certaines régions et zones.
  • Les types de machines A2 Standard ne sont disponibles que sur la plate-forme Cascade Lake.
  • Si votre VM utilise un type de machine A2 Standard, vous ne pouvez passer d'un type de machine A2 Standard qu'à un autre type de machine A2 Standard. Vous ne pouvez pas passer à un autre type de machine. Pour en savoir plus, consultez la page Modifier des VM optimisées pour les accélérateurs.
  • Vous ne pouvez pas utiliser le système d'exploitation Windows avec les types de machines A2 Standard <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Lorsque vous utilisez des systèmes d'exploitation Windows, choisissez un autre type de machine A2 Standard.</codea2-megagpu-16g<>
  • Vous ne pouvez pas effectuer un formatage rapide des disques SSD locaux associés à des VM Windows qui utilisent des types de machines A2 Standard. Pour formater ces disques SSD locaux, vous devez effectuer un formatage complet en utilisant l'utilitaire diskpart et en spécifiant format fs=ntfs label=tmpfs.
  • Les types de machines A2 Standard ne sont pas compatibles avec la location unique.

Types de disques compatibles avec la série A2

Les VM A2 peuvent utiliser les types de stockage de blocs suivants :

  • Hyperdisk ML (hyperdisk-ml)
  • Disque persistant avec équilibrage (pd-balanced)
  • Disque persistant SSD (performances, pd-ssd)
  • Disque persistant standard (pd-standard)
  • Disque SSD local : il est automatiquement associé aux VM créées à l'aide des types de machines ultra A2.

Si le type de machine est compatible, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent:

  • Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
  • La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :

    • Pour les types de machines avec moins de 32 vCPU:

      • 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
      • 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
    • Pour les types de machines comportant 32 vCPU ou plus:

      • 512 Tio pour tous les volumes Hyperdisk
      • 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
      • 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.

Série de machines G2

La série de machines G2 est disponible dans les types de machines standards comportant entre 4 et 96 processeurs virtuels et jusqu'à 432 Go de mémoire. Cette série de machines est optimisée pour les charges de travail d'inférence et graphiques.

La série de machines G2 fournit également les fonctionnalités suivantes :

  • GPU NVIDIA associés : chaque type de machine G2 dispose de GPU NVIDIA L4.

  • Amélioration des taux d'inférence : les types de machines G2 acceptent le type de données FP8 (virgule flottante de 8 bits), ce qui accélère les taux d'inférence de ML et réduit les besoins en mémoire.

  • Performances graphiques de nouvelle génération : les GPU NVIDIA L4 offrent des performances graphiques jusqu'à trois fois supérieures en utilisant des cœurs RT de troisième génération et la technologie NVIDIA DLSS 3 (Deep Learning Super Sampling).

  • Bande passante réseau hautes performances : avec la série de machines G2, vous pouvez atteindre jusqu'à 100 Gbit/s de bande passante réseau.

  • Stockage: vous pouvez ajouter jusqu'à 3 000 Gio de disque SSD local aux VM G2. Cela peut être utilisé en tant qu'espace de travail rapide ou pour envoyer des données aux GPU tout en évitant les goulots d'étranglement d'E/S.

    Vous pouvez également associer des volumes Hyperdisk et Persistent Disk aux VM G2, pour les applications nécessitant un stockage plus persistant. La capacité de stockage maximale dépend du nombre de processeurs virtuels disponibles sur la VM. Pour plus d'informations, consultez la page Types de disques compatibles.

  • Compatibilité avec les stratégies de concentration : vous permet de mieux contrôler l'emplacement physique de vos VM dans les centres de données. Cela permet une latence plus faible et une bande passante plus élevée pour l'emplacement des VM dans une seule zone de disponibilité. Pour en savoir plus, consultez la section Réduire la latence à l'aide de stratégies de concentration.

Types de machines G2

Chaque type de machine G2 est associé à un nombre fixe de GPU NVIDIA L4 et de processeurs virtuels. Chaque type de machine G2 dispose également d'une mémoire par défaut et d'une plage de mémoire personnalisée. La plage de mémoire personnalisée définit la quantité de mémoire que vous pouvez allouer à votre VM pour chaque type de machine. Vous pouvez spécifier votre mémoire personnalisée lors de la création de la VM.

Type de machine Nombre de GPU Mémoire GPU* (Go GDDR6) Nombre de vCPU Mémoire VM par défaut (Go) Plage de mémoire personnalisée VM (Go) Disque SSD local maximal compatible (Gio) Bande passante réseau maximale (Gbit/s)
g2-standard-4 1 24 4 16 Entre 16 et 32 375 10
g2-standard-8 1 24 8 32 Entre 32 et 54 375 16
g2-standard-12 1 24 12 48 Entre 48 et 54 375 16
g2-standard-16 1 24 16 64 Entre 54 et 64 375 32
g2-standard-24 2 48 24 96 Entre 96 et 108 750 32
g2-standard-32 1 24 32 128 Entre 96 et 128 375 32
g2-standard-48 4 96 48 192 Entre 192 et 216 1 500 50
g2-standard-96 8 192 96 384 Entre 384 et 432 3 000 100

*La mémoire du GPU est la mémoire d'un GPU pouvant être utilisée pour le stockage temporaire de données. Elle est distincte de la mémoire de la VM et est spécialement conçue pour gérer les demandes de bande passante plus élevées de vos charges de travail gourmandes en ressources graphiques.
Un processeur virtuel est implémenté sous la forme d'une technologie hyper-threading matérielle unique sur l'une des plates-formes de processeur disponibles.
 La bande passante de sortie maximale ne peut pas dépasser le nombre donné. La bande passante de sortie réelle dépend de l'adresse IP de destination et d'autres facteurs. Consultez la page Bande passante réseau.

Limites des machines G2

  • Vous ne bénéficiez pas de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les VM qui utilisent un type de machine G2.
  • Vous ne pouvez utiliser des types de machines G2 que dans certaines régions et zones.
  • Le type de machine G2 n'est disponible que sur la plate-forme Cascade Lake.
  • Les disques persistants standards (pd-standard) ne sont pas compatibles avec les VM qui utilisent des types de machines standards G2. Pour connaître les types de disques compatibles, consultez la section Types de disques compatibles pour G2.
  • Vous ne pouvez pas créer de GPU multi-instances sur des types de machines G2.
  • Si vous devez modifier le type de machine d'une VM G2, consultez la page Modifier des VM optimisées pour les accélérateurs.
  • Vous ne pouvez pas utiliser de Deep Learning VM Image en tant que disque de démarrage pour vos VM utilisant des types de machines G2.
  • Le pilote par défaut actuel de Container-Optimized OS n'est pas compatible avec les GPU L4 s'exécutant sur des types de machines G2. Container-Optimized OS n'accepte également qu'un ensemble sélectionné de pilotes. Si vous souhaitez utiliser Container-Optimized OS sur des types de machines G2, consultez les notes suivantes :
    • Utilisez une version de Container-Optimized OS compatible avec le pilote NVIDIA version 525.60.13 recommandée (minimum) ou ultérieure. Pour en savoir plus, consultez les Notes de version de Container-Optimized OS.
    • Lorsque vous installez le pilote, spécifiez la dernière version disponible compatible avec les GPU L4. Par exemple, sudo cos-extensions install gpu -- -version=525.60.13.
  • Vous devez utiliser Google Cloud CLI ou REST pour créer des VM G2 dans les scénarios suivants :
    • Vous souhaitez spécifier des valeurs personnalisées de la mémoire.
    • Vous souhaitez personnaliser le nombre de cœurs de processeur visibles.

Types de disques compatibles avec la série G2

Les VM G2 peuvent utiliser les types de stockage de blocs suivants :

  • Disque persistant avec équilibrage (pd-balanced)
  • Disque persistant SSD (performances, pd-ssd)
  • Hyperdisk ML (hyperdisk-ml)
  • Débit hyperdisque (hyperdisk-throughput)
  • SSD local

Si le type de machine est compatible, vous pouvez utiliser une combinaison de volumes Hyperdisk et Persistent Disk sur une VM, mais les restrictions suivantes s'appliquent:

  • Le nombre combiné de volumes Hyperdisk et Persistent Disk ne peut pas dépasser 128 par VM.
  • La capacité totale maximale de disque (en Tio), pour tous les types de disques, ne peut pas dépasser :

    • Pour les types de machines avec moins de 32 vCPU:

      • 257 Tio pour tous les volumes Hyperdisk ou Persistent Disk
      • 257 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
    • Pour les types de machines comportant 32 vCPU ou plus:

      • 512 Tio pour tous les volumes Hyperdisk
      • 512 Tio pour une combinaison de volumes Hyperdisk et Persistent Disk
      • 257 Tio pour tous les volumes Persistent Disk

Pour en savoir plus sur les limites de capacité, consultez les sections Limites de capacité Hyperdisk par VM et Capacité maximale des disques persistants.

Étape suivante