Wenn Sie eine virtuelle Maschine (VM) oder eine Bare-Metal-Instanz mit Compute Engine erstellen, geben Sie eine Maschinenreihe und einen Maschinentyp für die Instanz an. Jede Maschinenserie ist einer oder mehreren CPU-Plattformen zugeordnet. Wenn für eine Maschinenserie mehrere CPU-Plattformen verfügbar sind, können Sie eine Mindest-CPU-Plattform für die Compute-Instanz auswählen.
Eine CPU-Plattform bietet mehrere physische Prozessoren, die jeweils als Kern bezeichnet werden. Für die in Compute Engine verfügbaren Prozessoren kann ein einzelner CPU-Kern über simultanes Multithreading (SMT), das bei Intel-Prozessoren Intel-Hyper-Threading-Technologie bezeichnet wird, als mehrere Hardware-Threads ausgeführt werden. In Compute Engine wird jeder Hardware-Thread als virtuelle CPU (vCPU) bezeichnet. Einige Maschinenserien wie C4A, T2D und H3 verwenden kein SMT. Jede vCPU entspricht stattdessen einem Kern. Wenn vCPUs der VM gemeldet werden, dass sie verschiedene virtuelle Kerne belegen, sorgt Compute Engine dafür, dass diese vCPUs nie denselben physischen Kern teilen.
Der Maschinentyp Ihrer Compute-Instanz gibt die Anzahl der vCPUs an. Sie können die Anzahl der physischen CPU-Kerne mithilfe des Standardverhältnisses pro vCPU für den jeweiligen Kern ableiten:
- Bei den Maschinenserien C4A, Tau T2D, Tau T2A und H3 haben VMs immer eine vCPU pro Kern.
- Bei allen anderen Maschinenreihen haben die Compute-Instanzen standardmäßig zwei vCPUs pro Kern.
Optional können Sie die Anzahl der Threads pro Kern auf einen anderen Wert als den Standardwert festlegen, was sich für einige Arbeitslasten positiv auswirken kann. Beachten Sie dabei, dass der Maschinentyp Ihrer Compute-Instanz nicht mehr die richtige Anzahl von vCPUs widerspiegelt. Stattdessen bleiben die Preise und die Anzahl der physischen CPU-Kerne erhalten, wie sie es auch bei den Verhältnissen von zwei vCPUs pro Kern tun würden, und die Anzahl der vCPUs beträgt die Hälfte des vom Maschinentyp angegebenen Werts.
Arm-Prozessoren
Bei Arm-Prozessoren verwendet Compute Engine einen Thread pro Kern. Jede vCPU ist einem physischen Kern ohne SMT zugeordnet.
In der folgenden Tabelle sind die ARM-Prozessoren beschrieben, die für Compute Engine-Instanzen verfügbar sind.
CPU-Prozessor und SKU | Unterstützte Maschinenserien und ‑typen |
---|---|
Google Axion™-Prozessoren | C4A |
Ampere Altra Q64-30 | Tau T2A |
x86-Prozessoren
Bei den meisten x86-Prozessoren wird jede vCPU als einzelner Hardware-Thread implementiert. Die H3-Maschinenreihe ist die Ausnahme, wobei eine vCPU einen physischen Kern darstellt.
Intel-Prozessoren
Bei Intel Xeon-Prozessoren unterstützt die Intel-Hyper-Threading-Technologie die Ausführung mehrerer Threads gleichzeitig auf jedem Kern. Der Maschinentyp Ihrer Compute-Instanz bestimmt die Anzahl der vCPUs und den Arbeitsspeicher.
CPU-Prozessor | Prozessor-SKU | Unterstützte Maschinenserien und ‑typen | Basisfrequenz (GHz) | Turbofrequenz für alle Kerne (GHz) | Maximale Turbofrequenz für einzelnen Kern (GHz) |
---|---|---|---|---|---|
Skalierbarer Intel Xeon-Prozessor (Emerald Rapids) 5. Generation |
|||||
Intel® Xeon® Platinum 8581C-Prozessor |
2.3 | 3.1 | 4.0 | ||
Intel® Xeon® Platinum 8581C-Prozessor |
2.1 | 2,9 | 3.3 | ||
Skalierbarer Intel Xeon-Prozessor (Sapphire Rapids) 4. Generation |
Intel® Xeon® Platinum 8490H-Prozessor | 1.9 | 2,9 | 3,5 | |
Intel® Xeon® Platinum 8481C-Prozessor | 2.2 | 3,0 | 3,0 | ||
Intel® Xeon® Platinum 8481C-Prozessor | 2,0 | 3,8 | 2,9 | ||
Skalierbarer Xeon-Prozessor (Ice Lake) 3. Generation* |
Intel® Xeon® Platinum BR8373C-Prozessor |
2,6 | 3.4 | 3,5 | |
Skalierbarer Xeon-Prozessor (Cascade Lake) 2. Generation |
|||||
Intel® Xeon® Gold 6268CL-Prozessor | 2,8 | 3.4 | 3,9 | ||
Intel® Xeon® Gold 6253CL-Prozessor | 3.1 | 3,8 | 3,9 | ||
Intel® Xeon® Platinum 8280L-Prozessor | 2,5 | 3.4 | 4.0 | ||
Intel® Xeon® Platinum 8273CL-Prozessor | 2.2 | 2,9 | 3,7 | ||
Skalierbarer Xeon-Prozessor (Skylake) 1. Generation |
Intel® Xeon® Platinum 8173M-Prozessor | 2,0 | 2.7 | 3,5 | |
Intel Xeon E7 (Broadwell E7) | Intel® Xeon® E7-8880V4-Prozessor | 2.2 | 2,6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Intel® Xeon® E5-2696V4-Prozessor | 2.2 | 2,8 | 3,7 | |
Intel Xeon E5 v3 (Haswell) | Intel® Xeon® E5-2696V3-Prozessor | 2.3 | 2,8 | 3,8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Intel® Xeon® E5-2696V2-Prozessor | 2,5 | 3.1 | 3,5 | |
Intel Xeon E5 (Sandy Bridge) | Intel® Xeon® E5-2689-Prozessor | 2,6 | 3.2 | 3,6 |
*N2-Maschinentypen mit 96 oder mehr vCPUs erfordern die Intel Ice Lake-CPU.
AMD-Prozessoren
AMD-Prozessoren bieten eine optimierte Leistung und Skalierbarkeit mit SMT. In fast allen Fällen verwendet Compute Engine zwei Threads pro Kern, wobei jede vCPU ein Thread ist. Tau T2D ist die Ausnahme, bei der Compute Engine einen Thread pro Kern verwendet und jede vCPU einem physischen Kern zugeordnet ist. Der Maschinentyp Ihrer Compute-Instanz bestimmt die Anzahl der vCPUs und den Arbeitsspeicher.
CPU-Prozessor | Prozessor-SKU | Unterstützte Maschinenserien | Basisfrequenz (GHz) | Effektive Frequenz (GHz) | Maximale Verstärkungsfrequenz (GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa 4. Generation |
AMD EPYC™ 9B14 | 2,6 | 3.3 | 3,7 | |
AMD EPYC Milan 3. Generation |
AMD EPYC™ 7B13 | 2,45 | 2,8 | 3,5 | |
AMD EPYC Rome 2. Generation |
AMD EPYC™ 7B12 | 2,25 | 2.7 | 3.3 |
Frequenzverhalten
In den vorherigen Tabellen werden die Hardwarespezifikationen der CPUs beschrieben, die in Compute Engine verfügbar sind. Beachten Sie jedoch die folgenden Punkte:
Frequenz: Die Frequenz oder Taktrate eines PC misst die Anzahl der Zyklen, die die CPU pro Sekunde ausführt, gemessen in GHz (Gigahertz). Im Allgemeinen weisen höhere Frequenzen auf eine bessere Leistung hin. Unterschiedliche CPU-Designs verarbeiten Anweisungen jedoch unterschiedlich. Daher kann eine ältere CPU mit einer höheren Taktgeschwindigkeit von einer neueren CPU mit einer niedrigeren Taktgeschwindigkeit übertroffen werden, da die neuere Architektur die Befehle effizienter verarbeitet.
Basisfrequenz: Die Frequenz, mit der die CPU ausgeführt wird, wenn das System inaktiv oder bei geringer Last ist. Bei Ausführung mit ihrer Basisfrequenz verbraucht die CPU weniger Strom und erzeugt weniger Wärme.
Die Gastumgebung einer Compute-Instanz spiegelt die Basistaktfrequenz wider, unabhängig davon, mit welcher Frequenz die CPU tatsächlich ausgeführt wird.
Turbofrequenz für alle Kerne: Die Frequenz, mit der jede CPU in der Regel ausgeführt wird, wenn alle Kerne im Socket gleichzeitig aktiv sind. Unterschiedliche Arbeitslasten stellen auf der CPU eines Systems unterschiedliche Anforderungen. Boost-Technologien beheben diesen Unterschied und helfen, Prozesse an die Arbeitslastanforderungen anzupassen, indem Sie die CPU-Häufigkeit erhöhen.
- Die meisten Compute-Instanzen erhalten Turbofrequenz für alle Kerne, auch wenn nur die Basisfrequenz für die Gastumgebung angegeben wird.
- Ampere Altra Arm-Prozessoren können eine vorhersagbarere Leistung liefern, da die Frequenz für ARM-Prozessoren immer die Turbofrequenz für alle Kerne ist.
- C4-VMs können mit der maximalen Turbofrequenz aller Kerne ausgeführt werden, indem Sie das Feld AdvancedMachineFeature auf
ALL_CORE_MAX
festlegen. Wenn dieses Feld nicht festgelegt ist, wird die VM mit der Standardeinstellung ausgeführt, d. h. mit uneingeschränkter Taktfrequenz.
Maximale Turbofrequenz: Die Häufigkeit, mit der eine CPU bedient wird, wenn sie von einer anspruchsvollen Anwendung wie einer Videospiel- oder Designmodellanwendung überlastet wird. Sie gibt die maximale Frequenz eines einzelnen Kerns an, die eine CPU ohne Übertakten erreicht.
Prozessormanagement-Technologien: Intel-Prozessoren unterstützen mehrere Technologien, um den Stromverbrauch zu optimieren. Diese Technologien sind in zwei Kategorien oder Status unterteilt:
- C-Status sind Status, bei denen die CPU ausgewählte Funktionen reduziert oder deaktiviert hat.
- P-Status bieten eine Möglichkeit, die Frequenz und Spannung in der Ausführung des Prozessors zu skalieren, um den Stromverbrauch der CPU zu reduzieren.
Alle C4-Maschinentypen und bestimmte C2-Maschinentypen (30, 60 vCPUs), C2D-Maschinentypen (56, 112 vCPUs) und M2-Maschinentypen (208, 416 vCPUs) unterstützen über die
MWAIT
-Anweisung von der Instanz bereitgestellte C-State-Hinweise.Compute Engine-Instanzen bieten keine Möglichkeiten zur Kundensteuerung von P-Zuständen.
CPU-Features
Chiphersteller fügen den CPUs, die sie herstellen, erweiterte Technologien für Berechnungen, Grafik, Virtualisierung und Arbeitsspeicherverwaltung hinzu. Google Cloud unterstützt die Verwendung einiger dieser erweiterten Features in Compute Engine.
Advanced Matrix Extensions (AMX)
Intel AMX ist eine neue ISA-Erweiterung (Instructions Set Architecture, Befehlssatzarchitektur), die Arbeitslasten aus den Bereichen künstliche Intelligenz (KI) und maschinelles Lernen (ML) beschleunigen soll. AMX führt neue Anweisungen ein, mit denen Matrixmultiplikations- und Faltungsvorgänge ausgeführt werden können. Dies sind zwei der gängigsten Vorgänge bei KI und ML.
AMX wird auf Intel Xeon-Prozessoren der 5. Generation (Codename Emerald Rapids) unterstützt, die die C4-VM-Serie für allgemeine Zwecke unterstützen, sowie auf Intel Xeon-Prozessoren der 4. Generation (Codename Sapphire Rapids), die die A3-Accelerator-optimierten und C3-VMs für allgemeine Zwecke unterstützen. Alle C4- und C3-VM-Maschinentypen unterstützen AMX-Befehlssätze.
AMX führt zweidimensionale Register ein, die als Tiles bezeichnet werden und auf denen Beschleuniger Vorgänge ausführen können. AMX ist als erweiterbare Architektur gedacht. Der erste implementierte Beschleuniger wird als TMUL (Tile Matrix Multiply Unit) bezeichnet. Jeder CPU-Kern des Sapphire Rapids-Prozessors hat eine unabhängige AMX-TMUL.
Weitere technische Details zu Intel AMX finden Sie unter Intel AMX-Unterstützung in 5.16. Intel bietet eine Anleitung zu AMX unter Code Sample: Intel® Advanced Matrix Extensions (Intel® AMX) - Intrinsics Functions.
Anforderungen für die Verwendung von AMX
Für Intel AMX-Anweisungen gelten bestimmte Mindestanforderungen an die Software wie die folgenden:
- Für benutzerdefinierte Images wird AMX mit Linux-Kernel-Version 5.16 oder höher unterstützt.
- Die Compute Engine bietet Unterstützung für AMX in den folgenden öffentlichen Images:
- CentOS Stream 8 oder höher
- Container-Optimized OS 109 LTS (oder höher)
- RHEL 8 (neuester Build) oder höher
- Rocky Linux 8 (neuester Build) oder höher
- Ubuntu 22.04 oder höher
- Windows Server 2022 oder höher
- Tensorflow 2.9.1 oder höher
- Intel-Erweiterung für die Intel®-Optimierung für PyTorch
Informationen zur regionalen Verfügbarkeit von C4- und C3-VMs finden Sie unter Verfügbare Regionen und Zonen. Filtern Sie die Tabelle so, dass nur C4- oder C3-Maschinentypen angezeigt werden.
CPU-Funktionen für Bare-Metal-Instanzen
Neben allen Rohrechenressourcen des Servers können Bare-Metal-Instanzen, die auf skalierbaren Intel Xeon-Prozessoren der 4. Generation ausgeführt werden, mehrere integrierte, funktionsspezifische Beschleuniger und Offloads nutzen:
- Intel-QAT: Intel QuickAssist Technology (Intel QAT) beschleunigt die Komprimierung, Verschlüsselung und Entschlüsselung.
- Intel-DLB: Intel Dynamic Load Balancer (Intel DLB) trägt dazu bei, Datenwarteschlangen zu beschleunigen.
- Intel IAA: Der Intel In-Memory Analytics Accelerator (Intel IAA) verbessert die Leistung der Abfrageverarbeitung.
- Intel DSA: Intel Data Streaming Accelerator (Intel DSA) hilft, Daten schneller zu kopieren und zu verschieben.
Confidential Computing
Zum Schutz Ihrer Daten während der Verwendung können CPU-Plattformen, die Confidential Computing-Technologien unterstützen, zum Erstellen von Confidential VM-Instanzen verwendet werden.
Weitere Informationen zu den Anforderungen zum Erstellen einer Confidential VM-Instanz finden Sie unter Unterstützte Konfigurationen.
Nächste Schritte
- Weitere Informationen zu Maschinenfamilien
- Weitere Informationen zu VM-Instanzen.
- Weitere Informationen zu Images.
- Mindest-CPU-Plattform angeben.
Überzeugen Sie sich selbst
Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Compute Engine in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
Compute Engine kostenlos testen