HPC-optimierte Instanzen sind ideal für rechenintensive und Hochleistungs-Computing-Arbeitslasten (HPC). HPC-optimierte Instanzen bieten die höchste Leistung pro Kern und basieren auf einer Architektur, die Features wie einen nicht einheitlichen Speicherzugriff (NUMA) für eine optimale zuverlässige einheitliche Leistung verwendet.
Maschine | Arbeitslasten |
---|---|
H4D-Maschinenserie (Vorschau) |
|
H3-Maschinenserie |
|
Die folgenden Maschinenserien sind in dieser Maschinenfamilie verfügbar:
- H4D-Instanzen (Vorschau) werden von AMD EPYC Turin-Prozessoren mit einer Basisfrequenz von 2,7 GHz und einer maximalen Frequenz von 4,1 GHz unterstützt. H4D-Instanzen haben 192 Kerne (vCPUs) und bis zu 1.488 GB Arbeitsspeicher. H4D-Instanzen können mit lokalen SSD-Speichern und Cloud RDMA-Netzwerken verwendet werden.
- H3-Instanzen werden von zwei skalierbaren Intel Xeon-Prozessoren der 4.Generation (Codecode Sapphire Rapids) mit einer Kernkernfrequenz von 3,0 GHz unterstützt. H3-Instanzen haben 88 vCPUs und 352 GB DDR5-Arbeitsspeicher.
H4D-Maschinenserie
H4D-Instanzen basieren auf AMD EPYC Turin-Prozessoren der 5. Generation und Titanium-Auslagerungsprozessoren.
H4D-Instanzen bieten hohe Leistung, niedrige Kosten und Skalierbarkeit für Arbeitslasten mit mehreren Knoten. H4D-Instanzen sind Single-Threaded und für eng gekoppelte Anwendungen optimiert, die über mehrere Knoten skaliert werden. Diese Instanzen nutzen Technologien wie RDMA-fähige 200‑Gbit/s-Netzwerke und Cluster Director und legen den Schwerpunkt auf Leistung und arbeitslastspezifische Optimierungen. Außerdem können Sie den Dynamic Workload Scheduler für die geplante oder sofortige Clusterbereitstellung verwenden. Dadurch ist H4D ideal für HPC-Burst-Workloads.
Eine H4D-Instanz verwendet alle vCPUs auf einem gesamten Hostserver. H4D-Instanzen können die gesamte Hostnetzwerkbandbreite verwenden und haben eine Standardnetzwerkbandbreite von bis zu 200 Gbit/s. Die Bandbreite von der Instanz zum Internet ist jedoch auf 1 Gbit/s beschränkt.
Das gleichzeitige Multithreading (SMT) ist für H4D-Instanzen deaktiviert und kann nicht aktiviert werden. Außerdem gibt es keine Überbuchung, um eine optimale Leistungskonsistenz zu gewährleisten.
H4D-Instanzen sind on demand oder mit 1 oder 3 Jahren Rabatt für zugesicherte Nutzung (CUDs) verfügbar. Einen Vergleich dieser Methoden finden Sie unter Bereitstellungsmodelle für Compute Engine-Instanzen.
H4D-Einschränkungen
Für die H4D-Maschinenserie gelten die folgenden Einschränkungen:
- Die H4D-Maschinentypen sind nur als vordefinierte Maschinentypen verfügbar. Benutzerdefinierte Maschinentypen sind nicht verfügbar.
- Sie können keine GPUs mit H4D-Instanzen verwenden.
- Die ausgehende Datenübertragung ist auf 1 Gbit/s begrenzt.
- Sie können keine Maschinen-Images aus H4D-Instanzen erstellen.
- H4D-Maschinen-Images können nicht zum Erstellen von Laufwerken verwendet werden.
- Sie können Laufwerke nicht für Instanzen freigeben, weder im Modus für mehrere Autoren noch im Lesemodus.
- Die Leistung von Hyperdisk Balanced ist auf 15.000 IOPS und 240 MB/s Durchsatz beschränkt.
- Die Live-Migration wird für H4D-Instanzen nicht unterstützt.
H4D-Maschinentypen
Maschinentypen | vCPUs1 | Arbeitsspeicher (GB) | Titanium SSD | Standardbandbreite für ausgehenden Traffic (Gbit/s)2 | NUMA-Knoten |
---|---|---|---|---|---|
h4d-highmem-192-lssd |
192 | 1.488 | (10 × 375 GiB) 3.750 GiB |
Bis zu 200 Gbit/s | 2 |
1 Eine vCPU stellt einen gesamten Kern dar – kein gleichzeitiges Multithreading (SMT).
2 Die maximale Bandbreite für ausgehenden Traffic darf die angegebene Zahl nicht überschreiten. Die tatsächliche Bandbreite für ausgehenden Traffic hängt von der Ziel-IP-Adresse und anderen Faktoren ab.
Siehe Netzwerkbandbreite.
Unterstützte Laufwerkstypen für H4D
H4D-Instanzen können folgende Blockspeichertypen verwenden:
- Hyperdisk Balanced (
hyperdisk-balanced
) - Lokale Titanium-SSD
Laufwerks- und Kapazitätslimits
Folgende Einschränkungen gelten:
- Die Anzahl der Hyperdisk-Volumes darf 64 pro VM nicht überschreiten.
- Die maximale Gesamt-Laufwerkskapazität für alle Laufwerke darf 512 TiB nicht überschreiten.
Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Kapazitätslimits pro VM.
Die Speicherlimits für H4D werden in der folgenden Tabelle beschrieben:
Maximale Anzahl von Laufwerken pro Instanz | ||||
---|---|---|---|---|
Maschinentypen | Alle Hyperdisk -Typen |
Hyperdisk Balanced | Hyperdisk Durchsatz | Hyperdisk Extrem |
h4d-highmem-192-lssd |
64 | 8 | 0 | 0 |
Netzwerkunterstützung für H4D-Instanzen
H4D-Instanzen benötigen gVNIC-Netzwerkschnittstellen. H4D unterstützt eine Netzwerkbandbreite von bis zu 200 Gbit/s für Standardnetzwerke. Die Bandbreite für ausgehenden Traffic von der Instanz zum Internet ist auf 1 Gbit/s beschränkt.
Für RDMA-fähige Instanzen sind mindestens zwei Netzwerkschnittstellen (vNICs) erforderlich. Eine vNIC wird für normale Netzwerkfunktionen verwendet und ist vollständig mit dem Google-Netzwerk und optional mit dem Internet verbunden. Diese vNIC verwendet den gVNIC-Treiber. Die andere vNIC verwendet einen Intel iDPF-/iRDMA-Treiber und wird für die RDMA-Kommunikation verwendet. Die RDMA-vNIC ist nicht mit dem Internet verbunden.
Prüfen Sie vor der Migration zu H4D oder dem Erstellen von H4D-Instanzen, ob das von Ihnen verwendete Betriebssystem-Image für H4D vollständig unterstützt wird. Vollständig unterstützte Images bieten Unterstützung für eine Netzwerkbandbreite von 200 Gbit/s. Wenn Sie Cloud RDMA verwenden, muss das Betriebssystem-Image auch den IRDMA-Netzwerkschnittstellentyp unterstützen. Wenn auf Ihrer H4D-Instanz ein Betriebssystem ausgeführt wird, das nicht vollständig unterstützt wird oder ältere Versionen der Netzwerktreiber verwendet, kann Ihre Instanz möglicherweise nicht die maximale Netzwerkbandbreite für H4D-Instanzen erreichen.
Wartung von H4D-Instanzen
Während des Lebenszyklus einer Compute Engine-Instanz treten auf dem Host, auf dem Ihre Instanz ausgeführt wird, mehrere Hostereignisse auf. Ein Hostereignis kann die reguläre Wartung der Compute Engine-Infrastruktur oder in seltenen Fällen einen Hostfehler umfassen. Compute Engine wendet auch einfache, nicht unterbrechende Upgrades für den Hypervisor und das Netzwerk im Hintergrund an.
Die H4D-Maschinenserie bietet die folgenden Funktionen für die Hostwartung:
Maschinentyp | Typische Häufigkeit geplanter Wartungsereignisse | Wartungsverhalten | Erweiterte Benachrichtigung | On-Demand-Wartung | Wartung simulieren |
---|---|---|---|---|---|
h4d-highmem-192-lssd |
Mindestens 30 Tage | Wird mit Datenpersistenz auf lokalen SSDs beendet | 7 Tage | Ja | Ja |
Die in der vorherigen Tabelle angegebenen Wartungshäufigkeiten sind Schätzungen und keine Garantien. Für Compute Engine wird zeitweise eine Wartung häufiger durchgeführt.
H3-Maschinenserie
H3-Instanzen basieren auf den skalierbaren Intel Xeon-Prozessoren der 4. Generation (Codename Sapphire Rapids), DDR5-Arbeitsspeicher und Titanium-Auslagerungsprozessoren.
H3-Instanzen bieten das beste Preis-Leistungs-Verhältnis für rechenintensive Hochleistungs-Computing-Arbeitslasten in Compute Engine. H3-Instanzen sind Single-Threaded und eignen sich ideal für eine Vielzahl von Modellierungs- und Simulationsarbeitslasten, z. B. für numerische Dynamik, Absturzsicherheit, Genomik, Finanzmodellierung sowie allgemeines wissenschaftliches und technisches Computing. H3-Instanzen unterstützen die kompakte Platzierung, die für eng gekoppelte Anwendungen optimiert ist, die über mehrere Knoten skaliert werden.
Die H3-Serie ist in einer Größe verfügbar, die einen gesamten Hostserver umfasst. Um Kosten für die Lizenzierung zu sparen, können Sie die Anzahl der sichtbaren Kerne anpassen, aber Ihnen wird der gleiche Preis für die Instanz berechnet. H3-Instanzen können die gesamte Hostnetzwerkbandbreite verwenden und haben eine Standardnetzwerkbandbreite von bis zu 200 Gbit/s. Die Bandbreite von der Instanz zum Internet ist jedoch auf 1 Gbit/s beschränkt.
Das gleichzeitige Multithreading (SMT) ist für H3-Instanzen deaktiviert und kann nicht aktiviert werden. Außerdem gibt es keine Überbuchung, um eine optimale Leistungskonsistenz zu gewährleisten.
H3-Instanzen sind on demand oder mit 1 oder 3 Jahren Rabatt für zugesicherte Nutzung (CUDs) verfügbar. H3-Instanzen können mit Google Kubernetes Engine verwendet werden.
H3-Einschränkungen
Für die H3-Maschinenserie gelten die folgenden Einschränkungen:
- Die H3-Maschinenserie ist nur in einem vordefinierten Maschinentyp verfügbar. Benutzerdefinierte Maschinenformen sind nicht verfügbar.
- Sie können keine GPUs mit H3-Instanzen verwenden.
- Die ausgehende Datenübertragung ist auf 1 Gbit/s begrenzt.
- Die Leistung von Persistent Disk und Google Cloud Hyperdisk ist auf 15.000 IOPS und 240 MB/s Durchsatz beschränkt.
- H3-Instanzen unterstützen keine Maschinen-Images.
- H3-Instanzen unterstützen nur die NVMe-Speicherschnittstelle.
- H3-Instanz-Images können nicht zum Erstellen von Laufwerken verwendet werden.
- H3-Instanzen unterstützen das Freigeben von Laufwerken zwischen Instanzen weder im Modus für mehrere Autoren noch im Lesemodus.
H3-Maschinentypen
H3-Instanzen sind als vordefinierte Konfiguration mit 88 vCPUs und 352 GB Arbeitsspeicher verfügbar.
Maschinentypen | vCPUs1 | Arbeitsspeicher (GB) | Lokale SSD | Standardbandbreite für ausgehenden Traffic (Gbit/s)2 |
---|---|---|---|---|
h3-standard-88 |
88 | 352 | Nicht unterstützt | Bis zu 200 Gbit/s |
1 Eine vCPU stellt einen gesamten Kern dar – kein gleichzeitiges Multithreading (SMT).
2 Die maximale Bandbreite für ausgehenden Traffic darf die angegebene Zahl nicht überschreiten. Die tatsächliche Bandbreite für ausgehenden Traffic hängt von der Ziel-IP-Adresse und anderen Faktoren ab.
Siehe Netzwerkbandbreite.
Unterstützte Laufwerkstypen für H3
H3-Instanzen können folgende Blockspeichertypen verwenden:
- Abgestimmter nichtflüchtiger Speicher (
pd-balanced
) - Hyperdisk Balanced (
hyperdisk-balanced
) - Hyperdisk Durchsatz (
hyperdisk-throughput
)
Laufwerks- und Kapazitätslimits
Wenn der Maschinentyp dies unterstützt, können Sie einer Instanz eine Mischung aus Hyperdisk- und Persistent Disk-Volumes anhängen. Es gelten jedoch die folgenden Einschränkungen:
- Die Gesamtzahl der Hyperdisk- und Persistent Disk-Volumes darf 128 pro Instanz nicht überschreiten.
Die maximale Gesamt-Laufwerkskapazität (in TiB) für alle Laufwerkstypen darf Folgendes nicht überschreiten:
- 512 TiB für alle Hyperdisk-Volume
- 512 TiB für eine Mischung aus Hyperdisk und Persistent Disk
- 257 TiB für alle Persistent Disk-Volumes
Weitere Informationen zu den Kapazitätslimits finden Sie unter Hyperdisk-Größen- und Anhängelimits und Maximale Kapazität von Persistent Disk.
Die Speicherlimits für H3-VMs sind in der folgenden Tabelle aufgeführt:
Maximale Anzahl von Laufwerken pro Instanz | |||||
---|---|---|---|---|---|
Maschinentypen | Alle Laufwerkstypen 1 | Alle Hyperdisk -Typen |
Hyperdisk Balanced | Hyperdisk Durchsatz | Hyperdisk Extrem |
h3-standard-88 |
128 | 64 | 8 | 64 | 0 |
1 Dieses Limit gilt für Persistent Disk und Hyperdisk, nicht jedoch für lokale SSDs.
Netzwerkunterstützung für H3-Instanzen
H3-Instanzen benötigen gVNIC-Netzwerkschnittstellen. H3 unterstützt eine Netzwerkbandbreite von bis zu 200 Gbit/s für Standardnetzwerke.
Prüfen Sie vor der Migration zu H3 oder dem Erstellen von H3-Instanzen, ob das von Ihnen verwendete Betriebssystem-Image den gVNIC-Treiber unterstützt. Um die bestmögliche Leistung auf H3-Instanzen zu erzielen, wählen Sie auf dem Tab Netzwerkfunktionen der Tabelle mit den Betriebssystemdetails ein Betriebssystem-Image aus, das sowohl „Tier_1-Netzwerk“ als auch „200 Gbit/s Netzwerkbandbreite“ unterstützt. Diese Images enthalten einen aktualisierten gVNIC-Treiber, auch wenn das Gastbetriebssystem die Treiberversion gve
als 1.0.0 anzeigt. Wenn auf Ihrer H3-Instanz ein Betriebssystem mit einer älteren Version des gVNIC-Treibers ausgeführt wird, wird dies weiterhin unterstützt. Die Leistung der Instanz ist jedoch möglicherweise nicht optimal, z. B. ist die Netzwerkbandbreite geringer oder die Latenz höher.
Wenn Sie ein benutzerdefiniertes Betriebssystem-Image mit der H3-Maschinenserie verwenden, können Sie den neuesten gVNIC-Treiber manuell installieren. Für die Verwendung mit H3-Instanzen wird die gVNIC-Treiberversion 1.4.2 oder höher empfohlen. Google empfiehlt die Verwendung der neuesten gVNIC-Treiberversion, um von den zusätzlichen Funktionen und Fehlerkorrekturen zu profitieren.
Wartung von H3-Instanzen
Während des Lebenszyklus einer Compute Engine-Instanz treten auf dem Host, auf dem Ihre Instanz ausgeführt wird, mehrere Hostereignisse auf. Ein Hostereignis kann die reguläre Wartung der Compute Engine-Infrastruktur oder in seltenen Fällen einen Hostfehler umfassen. Compute Engine wendet auch einfache, nicht unterbrechende Upgrades für den Hypervisor und das Netzwerk im Hintergrund an.
Die H3-Maschinenserie bietet die folgenden Funktionen für die Hostwartung:
Maschinentyp | Typische Häufigkeit geplanter Wartungsereignisse | Wartungsverhalten | Erweiterte Benachrichtigung | On-Demand-Wartung | Wartung simulieren |
---|---|---|---|---|---|
h3-standard-88 |
Mindestens 30 Tage | Live-Migration | 7 Tage | Ja | Ja |
Die in der vorherigen Tabelle angegebenen Wartungshäufigkeiten sind Schätzungen und keine Garantien. Für Compute Engine wird zeitweise eine Wartung häufiger durchgeführt.
Nächste Schritte
- Instanz erstellen
- #TO-DO: Link zum Erstellen von H4D-Instanzen im Bulk erstellen
- Preise für Compute Engine-Instanzen
- Instanz mit einem Netzwerk mit hoher Bandbreite konfigurieren