Google Cloud propose une gamme de serveurs optimisés par Arm dans Compute Engine via les séries de machines C4A et A4X. L'architecture Arm est optimisée pour accroître l'efficacité énergétique. Par conséquent, elle peut offrir un meilleur rapport prix-performances.
Les processeurs Arm sont courants sur les serveurs standards en raison de leur efficacité énergétique par rapport aux serveurs x86. Les téléphones mobiles et les ordinateurs portables sont des exemples d'appareils exécutés sur un processeur Arm. Avec l'ensemble d'instructions réduit d'un processeur Arm, vous bénéficiez de meilleures performances avec une batterie et une consommation d'énergie réduites.
Par exemple, C4A utilise Axion, le processeur Arm personnalisé de Google, qui est basé sur le processeur Arm Neoverse V2. Le Neoverse V2 est le premier processeur de la série V à bénéficier des améliorations apportées à Armv9 en termes de performances, de consommation d'énergie et de sécurité. Elle est conçue pour le calcul hautes performances, le machine learning et le cloud computing à usage général. Envisagez d'utiliser des machines virtuelles (VM) Arm à usage général C4A pour l'un des objectifs suivants :
- Exécuter des charges de travail nécessitant beaucoup de ressources de calcul qui doivent effectuer un scaling rapide de l'utilisation si nécessaire
- Optimiser le rapport prix-performances sur les charges de travail compatibles avec Arm
- Créez des solutions sur des piles logicielles Open Source modernes.
- Développer et tester des systèmes mobiles ou intégrés utilisant un processeur Arm
- Déterminer si votre charge de travail est adaptée à un processeur Arm
Pour utiliser des GPU avec un processeur basé sur Arm, choisissez la série de machines A4X, qui s'exécute sur la plate-forme NVIDIA GB200 NVL72. Les VM créées à l'aide de cette série de machines sont associées à des superchips NVIDIA GB200 Grace Blackwell. Cette série de machines est optimisée pour les charges de travail de calcul CUDA (Compute Unified Device Architecture) massivement parallélisées, telles que le machine learning (ML) et le calcul hautes performances (HPC, High Performance Computing).
Série de machines A4X
A4X est la première VM Compute Engine avec des processeurs basés sur Arm et des GPU associés. Les types de machines A4X offrent jusqu'à 140 processeurs virtuels et 884 Go de mémoire. Les A4X utilisent des GPU NVIDIA GB200, qui offrent 180 Go de mémoire par GPU. A4X dispose de deux sockets avec des processeurs NVIDIA Grace Arm connectés à quatre GPU B200 avec une communication rapide de puce à puce (NVLink C2C).
A4X est disponible dans le type de machine a4x-highgpu-4g
.
Options de stockage pour les instances A4X
Les A4X peuvent être utilisés avec le stockage associé Google Cloud Hyperdisk et sont fournis avec 12 000 Gio de SSD local. Compute Engine associe automatiquement les disques SSD locaux à vos instances A4X lors de la création de l'instance.
Images d'OS
Les instances A4X sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image d'OS publique basée sur Arm.
Série de machines C4A
C4A est la première VM basée sur Arm et conçue sur le processeur Axion Arm64 de Google. Les types de machines C4A offrent jusqu'à 72 processeurs virtuels et 576 Go de mémoire DDR5-5600. Les machines C4A sont disponibles dans les types de machines standard
, highmem
et highcpu
.
C4A est basé sur Titanium, qui utilise des déchargements réseau et permet des performances réseau Tier_1 par VM allant jusqu'à 100 Gbit/s avec l'interface réseau gVNIC. C4A est également compatible avec l'interface de disque NVMe avec les disques Hyperdisk Balanced et Hyperdisk Extreme.
Multithreading simultané
Pour la série de machines C4A, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT). Ainsi, les VM C4A offrent de meilleures performances par processeur virtuel qu'une VM avec SMT activé. Bien que SMT offre des avantages pour certaines charges de travail, les cœurs à un seul thread sont parfaits pour les charges de travail nécessitant beaucoup de ressources de calcul, car les processus peuvent accéder à l'intégralité du cœur plutôt que de le partager avec d'autres processus.
Images d'OS
Les VM C4A sont compatibles avec les images d'OS publiques basées sur Arm. Vous pouvez également créer des images personnalisées à l'aide d'une image Arm publique.
Série de machines Tau T2A
La série de machines Tau T2A Arm s'exécute sur le processeur Ampere Altra Arm à 64 cœurs à une fréquence tout cœur de 3 GHz. La série Tau T2A permet d'exécuter des charges de travail qui s'exécutent de façon optimale ou exclusivement sur Arm.
La série de machines Tau T2A propose des types de machines prédéfinis comportant jusqu'à 48 cœurs physiques, avec 4 Go de mémoire par processeur virtuel. Les types de machines Tau T2A s'exécutent dans un seul nœud NUMA.
Les types de machines Tau T2A ne sont compatibles qu'avec l'interface NVMe pour le stockage et la carte d'interface réseau virtuelle Google (gVNIC) pour la mise en réseau. Les interfaces Virtio-Net et SCSI ne sont pas acceptées. Toutes les images de l'OS Arm disponibles publiquement sont configurées pour utiliser les interfaces NVMe et gVNIC. gVNIC est une interface réseau conçue spécifiquement pour Compute Engine. Elle offre de meilleures performances, et une bande passante et un débit réseau plus élevés.
Pour cette série de machines, chaque processeur virtuel est sauvegardé par un seul cœur sans multithreading simultané (SMT).
Recommandations concernant les charges de travail
La série de machines C4A est un excellent choix pour un large éventail de charges de travail évolutives et intensives en calcul, en particulier lorsque le rapport prix/performances est une préoccupation majeure. Envisagez d'utiliser C4A lorsque vous déployez des charges de travail telles que les suivantes :
- Traitement des données de ML
- Inférence de ML et diffusion de modèles
- Diffusion d'applications, diffusion Web et diffusion de jeux
- Développement de systèmes intégrés
- Développement sur CI/CD sur Arm
- Encodage, transcodage et traitement des vidéos et images
- Échanges et diffusion d'annonces numériques
- Serveurs cache
- Découverte de médicaments par calcul
- Développement d'Android
- Développement de logiciels automobiles classiques ou autonomes
Étapes suivantes
- Consultez les caractéristiques et les fonctionnalités de la série de machines A4X.
- Consultez les spécifications de la série de machines C4A.
- Découvrez les plates-formes de processeur disponibles pour Google Cloud.
- Créez et démarrez une instance Compute Engine à l'aide d'une image d'OS Arm.