Lorsque vous créez une machine virtuelle (VM) ou une instance bare metal à l'aide de Compute Engine, vous spécifiez une série de machines et un type de machine pour l'instance. Chaque série de machines est associée à une ou plusieurs plates-formes de processeur. Si plusieurs plates-formes de processeur sont disponibles pour une série de machines, vous pouvez sélectionner une configuration minimale de plate-forme de processeur pour l'instance de calcul.
Une plate-forme de processeur propose plusieurs processeurs physiques, chacun étant appelé "cœur". Pour les processeurs disponibles sur Compute Engine, un seul cœur de processeur peut s'exécuter sous la forme de plusieurs threads matériels via le multithreading simultané (SMT), connu sur les processeurs Intel comme la technologie Intel Hyper-Threading. Sur Compute Engine, chaque thread matériel est appelé "vCPU (processeur virtuel)". Certaines séries de machines, telles que C4A, T2D et H3, n'utilisent pas le SMT, et chaque vCPU représente un cœur. Lorsque les processeurs virtuels sont signalés à la VM comme occupant différents cœurs virtuels, Compute Engine s'assure que ces processeurs virtuels ne partagent jamais le même cœur physique.
Le type de machine de votre instance de calcul spécifie son nombre de processeurs virtuels, et vous pouvez déduire son nombre de cœurs de processeur physiques à l'aide du ratio de vCPU par cœur par défaut pour cette série de machines :
- Pour les séries de machines C4A, Tau T2D, Tau T2A et H3, les VM disposent toujours d'un processeur virtuel par cœur.
- Pour toutes les autres séries de machines, les instances de calcul disposent par défaut de deux vCPU par cœur.
Vous pouvez éventuellement définir le nombre de threads par cœur sur une valeur autre que celle par défaut, ce qui peut être bénéfique pour certaines charges de travail. Il est important de noter que lorsque vous effectuez cette opération, le type de machine de votre instance de calcul ne reflète plus le nombre correct de vCPU. Les tarifs et le nombre de cœurs de processeur physiques restent identiques à ceux des deux vCPU par défaut, et le nombre de vCPU est moitié inférieur à la valeur indiquée par le type de machine.
Processeurs Arm
Pour les processeurs Arm, Compute Engine utilise un thread par cœur. Chaque processeur virtuel correspond à un cœur physique sans SMT.
Le tableau suivant décrit les processeurs Arm disponibles pour les instances Compute Engine.
Processeur et SKU du processeur | Séries et types de machines compatibles |
---|---|
Processeurs Google Axion™ | C4A |
Ampere Altra Q64-30 | Tau T2A |
Processeurs x86
Pour la plupart des processeurs x86, chaque processeur virtuel est mis en œuvre sous la forme d'un seul thread. La série de machines H3 constitue l'exception, avec un processeur virtuel représentant un cœur physique.
Processeurs Intel
Sur les processeurs Intel Xeon, la technologie Intel Hyper-Threading permet d'exécuter plusieurs threads simultanément sur chaque cœur. Le type de machine de votre instance de calcul détermine le nombre de ses vCPU et sa mémoire.
Processeur | SKU du processeur | Séries et types de machines compatibles | Fréquence de base (GHz) | Fréquence turbo tout cœur (GHz) | Fréquence turbo maximale à cœur unique (GHz) |
---|---|---|---|---|---|
Processeur évolutif Intel Xeon (Emerald Rapids) 5e génération |
|||||
Processeur Intel® Xeon® Platinum 8581C |
2.3 | 3.1 | 4.0 | ||
Processeur Intel® Xeon® Platinum 8581C |
2.1 | 2.9 | 3.3 | ||
Processeur évolutif Intel Xeon (Sapphire Rapids) 4e génération |
Processeur Intel® Xeon® Platinum 8490H | 1.9 | 2.9 | 3.5 | |
Processeur Intel® Xeon® Platinum 8481C | 2.2 | 3,0 | 3,0 | ||
Processeur Intel® Xeon® Platinum 8481C | 2,0 | 3.8 | 2.9 | ||
Processeur évolutif Intel Xeon (Ice Lake) 3e génération |
Processeur Intel® Xeon® Platinum 8373C |
2,6 | 3.4 | 3,5 | |
Processeur évolutif Intel Xeon (Cascade Lake) 2e génération |
|||||
Processeur Intel® Xeon® Gold 6268CL | 2,8 | 3.4 | 3.9 | ||
Processeur Intel® Xeon® Gold 6253CL | 3.1 | 3.8 | 3.9 | ||
Processeur Intel® Xeon® Platinum 8280L | 2.5 | 3.4 | 4.0 | ||
Processeur Intel® Xeon® Platinum 8273CL | 2.2 | 2.9 | 3.7 | ||
Processeur évolutif Intel Xeon (Skylake) 1re génération |
Processeur Intel® Xeon® Scalable Platinum 8173M | 2,0 | 2.7 | 3.5 | |
Intel Xeon E7 (Broadwell E7) | Processeur Intel® Xeon® E7-8880V4 | 2.2 | 2.6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Processeur Intel® Xeon® E5-2696V4 | 2.2 | 2.8 | 3.7 | |
Intel Xeon E5 v3 (Haswell) | Processeur Intel® Xeon® E5-2696V3 | 2.3 | 2.8 | 3.8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Processeur Intel® Xeon® E5-2696V2 | 2.5 | 3.1 | 3.5 | |
Intel Xeon E5 (Sandy Bridge) | Processeur Intel® Xeon® E5-2689 | 2,6 | 3.2 | 3.6 |
*Les types de machines N2 comportant au moins 96 vCPU nécessitent le processeur Intel Ice Lake.
Processeurs AMD
Les processeurs AMD offrent des performances et une évolutivité optimisées à l'aide de SMT. Dans presque tous les cas, Compute Engine utilise deux threads par cœur et chaque processeur virtuel correspond à un thread. Tau T2D est l'exception dans laquelle Compute Engine utilise un thread par cœur et chaque processeur virtuel correspond à un cœur physique. Le type de machine de votre instance de calcul détermine le nombre de ses vCPU et sa mémoire.
Processeur | SKU du processeur | Série de machines compatible | Fréquence de base (GHz) | Fréquence effective (GHz) | Fréquence boost maximale (GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa 4e génération |
AMD EPYC™ 9B14 | 2,6 | 3.3 | 3.7 | |
AMD EPYC Milan 3e génération |
AMD EPYC™ 7B13 | 2,45 | 2.8 | 3,5 | |
AMD EPYC Rome 2e génération |
AMD EPYC 7B12 | 2,25 | 2.7 | 3.3 |
Comportement de la fréquence
Les tableaux précédents décrivent les spécifications matérielles des processeurs disponibles avec Compute Engine, mais gardez à l'esprit les points suivants :
Fréquence : la fréquence d'un PC, ou la vitesse d'horloge, mesure le nombre de cycles que le processeur exécute par seconde en GHz (gigahertz). En règle générale, les fréquences plus élevées indiquent de meilleures performances. Cependant, différentes conceptions de processeur gèrent les instructions différemment. Ainsi, un ancien processeur avec une vitesse d'horloge plus élevée peut être plus performant qu'un nouveau processeur avec une vitesse d'horloge plus faible, car l'architecture la plus récente traite les instructions plus efficacement.
Fréquence de base : fréquence à laquelle le processeur s'exécute lorsque le système est inactif ou en charge faible. Lors de son exécution à sa fréquence de base, le processeur extrait moins de puissance et produit moins de chaleur.
L'environnement invité d'une instance de calcul reflète la fréquence de base, quelle que soit la fréquence réelle d'exécution du processeur.
Fréquence turbo tout cœur : fréquence à laquelle chaque processeur s'exécute généralement lorsque tous les cœurs du socket ne sont pas inactifs en même temps. Différentes charges de travail imposent différentes exigences au processeur d'un système. Les technologies d'amélioration répondent à cette différence et aident les processus à s'adapter aux exigences des charges de travail en augmentant la fréquence du processeur.
- La plupart des instances de calcul obtiennent la fréquence turbo tout cœur, même si seule la fréquence de base est présentée dans l'environnement invité.
- Les processeurs Ampere Altra Arm peuvent offrir des performances plus prévisibles, car la fréquence des processeurs Arm est toujours la fréquence turbo tout cœur.
- Les VM C4 peuvent s'exécuter à la fréquence turbo maximale de tous les cœurs en définissant le champ AdvancedMachineFeature sur
ALL_CORE_MAX
. Si ce champ n'est pas défini, la VM s'exécute avec le paramètre par défaut, à savoir la fréquence non limitée.
Fréquence turbo maximale : fréquence à laquelle le processeur cible lorsqu'une application exigeante telle qu'un jeu vidéo ou une application de modélisation de conception est sollicitée. Il s'agit de la fréquence maximale à cœur unique d'un processeur sans sursollicitation.
Technologies de gestion de l'alimentation des processeurs : les processeurs Intel sont compatibles avec plusieurs technologies permettant d'optimiser la consommation d'énergie. Ces technologies sont divisées en deux catégories, ou états :
- Le C-state indique l'état où le processeur a réduit ou désactivé les fonctions sélectionnées.
- Le P-state permette de mettre à l'échelle la fréquence et la tension auxquelles le processeur s'exécute afin de réduire sa consommation d'énergie.
Tous les types de machines C4, ainsi que certains types de machines C2 (30, 60 processeurs virtuels), C2D (56, 112 processeurs virtuels) et M2 (208, 416 processeurs virtuels) sont compatibles avec les suggestions C-state ("hints") fournies par l'instance via l'instruction
MWAIT
.Les instances Compute Engine ne fournissent aucune installation pour le contrôle client des P-state.
Fonctionnalités du processeur
Les fabricants de puces ajoutent des technologies avancées pour les calculs, les graphiques, la virtualisation et la gestion de la mémoire aux processeurs qu'ils produisent. Google Cloud permet d'utiliser certaines de ces fonctionnalités avancées avec Compute Engine.
Extensions matricielles avancées (AMX)
Intel AMX est une nouvelle extension d'architecture d'ensemble d'instructions (ISA) conçue pour accélérer les charges de travail d'intelligence artificielle (IA) et de machine learning (ML). AMX introduit de nouvelles instructions pouvant être utilisées pour effectuer des opérations de multiplication et de convolution de matrice, qui sont deux des opérations les plus courantes en IA et ML.
AMX est compatible avec les processeurs Intel Xeon de 5e génération (nom de code Emerald Rapids), qui alimentent la série de VM à usage général C4, ainsi que les processeurs Intel Xeon de 4e génération (nom de code Sapphire Rapids), qui alimentent les VM à usage général C3 et optimisées pour les accélérateurs A3. Tous les types de machines des VM C4 et C3 sont compatibles avec les ensembles d'instructions AMX.
AMX introduit des registres en deux dimensions appelés tiles sur lesquels les accélérateurs peuvent effectuer des opérations. AMX est destiné à être une architecture extensible. Le premier accélérateur mis en œuvre est appelé unité de multiplication de matrice de "tile" (TMUL). Chaque cœur de processeur du processeur Sapphire Rapids possède une unité TMUL AMX indépendante.
Vous trouverez plus de détails techniques sur Intel AMX dans la section Compatibilité Intel AMX dans la version 5.16. Intel propose un tutoriel sur AMX dans Code Sample: Intel® Advanced Matrix Extensions (Intel® AMX) - Intrinsics Functions.
Prérequis pour utiliser AMX
Les instructions Intel AMX sont soumises à certaines exigences logicielles minimales :
- Pour les images personnalisées, AMX est compatible avec le noyau Linux 5.16 ou version ultérieure.
- Compute Engine propose la compatibilité AMX dans les images publiques suivantes :
- CentOS Stream 8 ou version ultérieure
- Container-Optimized OS 109 LTS ou version ultérieure
- RHEL 8 (dernière compilation) ou version ultérieure
- Rocky Linux 8 (dernière version) ou version ultérieure
- Ubuntu 22.04 ou version ultérieure
- Windows Server 2022 ou version ultérieure
- TensorFlow 2.9.1 ou version ultérieure
- Extension Intel pour l'optimisation Intel® pour PyTorch
Pour connaître la disponibilité régionale des VM C4 et C3, consultez la section Régions et zones disponibles et filtrez le tableau pour n'afficher que les types de machines C4 ou C3.
Fonctionnalités de processeur disponibles pour les instances bare metal
En plus de proposer toutes les ressources de calcul brutes du serveur, les instances bare metal qui s'exécutent sur des processeurs Intel Xeon Scalable de 4e génération peuvent utiliser plusieurs accélérateurs et déchargements intégrés spécifiques à la fonction :
- Intel-QAT : Intel QuickAssist Technology (Intel QAT) accélère la compression, le chiffrement et le déchiffrement.
- Intel-DLB : Intel Dynamic Load Balancer (Intel DLB) permet d'accélérer les files d'attente de données.
- Intel IAA : Intel In-Memory Analytics Accelerator (Intel IAA) améliore les performances de traitement des requêtes.
- Intel DSA : Intel Data Streaming Accelerator (Intel DSA) permet de copier et de déplacer les données plus rapidement.
Informatique confidentielle
Pour protéger vos données lorsqu'elles sont utilisées, les plates-formes de processeur compatibles avec les technologies d'informatique confidentielle peuvent être utilisées pour créer des instances de Confidential VM.
Pour en savoir plus sur les exigences de création d'une instance Confidential VM, consultez la section Configurations compatibles.
Étape suivante
- Apprenez-en plus sur les familles de machines.
- Apprenez-en plus sur les instances de machines virtuelles.
- Apprenez-en plus sur les images.
- Découvrez comment spécifier une configuration minimale de la plate-forme de processeur.
Faites l'essai
Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits pour exécuter, tester et déployer des charges de travail.
Profiter d'un essai gratuit de Compute Engine