Profilo di rete RDMA
Questa pagina fornisce una panoramica del profilo di rete RDMA in Google Cloud.
Informazioni sul profilo di rete RDMA
Il profilo di rete RDMA consente di creare una rete Virtual Private Cloud (VPC) in cui è possibile eseguire carichi di lavoro di IA su istanze VM dotate di NIC NVIDIA ConnectX. Queste NIC supportano la connettività RDMA (remote Direct Memory Access) e hanno il tipo di NIC MRDMA
in Google Cloud.
Una rete VPC con il profilo di rete RDMA supporta la comunicazione RDMA a bassa latenza e a elevata larghezza di banda tra le GPU delle VM create nella rete utilizzando RDMA su Ethernet convergente v2 (RoCE v2).
Per saperne di più sull'esecuzione di carichi di lavoro IA in Google Cloud, consulta la documentazione sull'ipercomputer IA.
Specifiche
Le reti VPC create con il profilo di rete RDMA hanno le seguenti specifiche:
- La rete accetta solo allegati da NIC
MRDMA
. Le VM A3 Ultra e le VM A4 sono gli unici tipi di VM che supportano le NICMRDMA
. Altri tipi di NIC, ad esempio le GVNIC di una VM A3 Ultra, devono essere collegati a una normale rete VPC. - L'insieme di funzionalità supportate nella rete è preconfigurato daGoogle Cloud per supportare l'esecuzione di carichi di lavoro IA che richiedono RDMA. Le reti VPC con il profilo di rete RDMA hanno più vincoli rispetto alle normali reti VPC. Per maggiori informazioni, vedi Funzionalità supportate e non supportate.
La rete è vincolata alla zona del profilo di rete specificata quando crei la rete. Ad esempio, tutte le istanze create nella rete devono essere create nella zona del profilo di rete. Inoltre, tutte le subnet create nella rete devono trovarsi nella regione corrispondente alla zona del profilo di rete.
Il profilo di rete RDMA non è disponibile in tutte le zone. Per visualizzare le zone in cui è disponibile il profilo di rete, consulta Zone supportate. Puoi anche visualizzare le istanze del profilo di rete specifiche per zona disponibili elencando i profili di rete.
Il nome della risorsa del profilo di rete RDMA specificato durante la creazione della rete ha il formato
ZONE-vpc-roce
, ad esempioeurope-west1-b-vpc-roce
.La MTU predefinita in una rete VPC creata con il profilo di rete RDMA è
8896
. Questa impostazione predefinita offre al driver RDMA nel sistema operativo guest della VM la flessibilità di utilizzare una MTU appropriata. La MTU predefinita nelle reti VPC normali potrebbe essere troppo piccola per alcuni carichi di lavoro RDMA. Per prestazioni ottimali, Google consiglia di non modificare la MTU predefinita.
Zone supportate
Il profilo di rete RDMA è disponibile nelle zone seguenti:
europe-west1-b
us-central1-a
us-central1-b
us-east4-b
us-west1-c
Funzionalità supportate e non supportate
Questa sezione descrive le funzionalità supportate e non supportate nelle reti VPC create con il profilo di rete RDMA.
Le funzionalità delle reti VPC normali sono supportate a meno che non siano configurate per essere disattivate dal profilo di rete, dipendono da una funzionalità disabilitata dal profilo di rete o non si applicano al traffico proveniente dalle NIC RDMA, come descritto in questa sezione.
Funzionalità configurate dal profilo di rete
Questa tabella elenca le funzionalità specifiche configurate dalla risorsa del profilo di rete e descrive se sono supportate o meno nelle reti VPC create con il profilo di rete RDMA. Include i valori delle proprietà del profilo di rete impostati da Google Cloud.
Funzionalità | Supportato | Nome proprietà | Valore della proprietà | Dettagli |
---|---|---|---|---|
MRDMA NIC |
interfaceTypes |
MRDMA |
La rete supporta solo La rete non supporta altri tipi di NIC, come |
|
NIC multipli nella stessa rete | allowMultiNicInSameNetwork |
MULTI_NIC_IN_SAME_NETWORK_ALLOWED |
La rete supporta VM con più NIC in cui più NIC della stessa VM possono essere collegate alla stessa rete VPC. Tuttavia, le NIC devono essere collegate a subnet diverse della rete.
Consulta Considerazioni sulle prestazioni per più NIC nella stessa rete VPC. |
|
Subnet solo IPv4 | allowedSubnetStackTypes |
SUBNET_STACK_TYPE_IPV4_ONLY |
La rete supporta subnet solo IPv4, inclusi gli stessi intervalli IPv4 validi delle normali reti VPC. La rete non supporta le subnet solo IPv6 o a doppio stack. Per ulteriori informazioni, consulta Tipi di subnet. |
|
PRIVATE scopo della subnet |
allowedSubnetPurposes |
SUBNET_PURPOSE_PRIVATE |
La rete supporta subnet normali, che hanno uno scopo di
La rete non supporta le subnet Private Service Connect, solo le subnet solo proxy o le subnet Private NAT. Per saperne di più, consulta Scopi delle subnet. |
|
Scopo dell'indirizzo GCE_ENDPOINT |
addressPurposes |
GCE_ENDPOINT |
La rete supporta gli indirizzi IP con lo scopo La rete non supporta indirizzi IP per scopi speciali, ad esempio
lo scopo |
|
Indirizzi IP esterni per le VM | allowExternalIpAccess |
EXTERNAL_IP_ACCESS_BLOCKED |
La rete non supporta l'assegnazione di indirizzi IP esterni alle VM. Le NIC connesse alla rete non riescono a raggiungere la rete internet pubblica. | |
Intervalli IP alias | allowAliasIpRanges |
ALIAS_IP_RANGE_BLOCKED |
La rete non supporta l'utilizzo di intervalli IP alias, inclusi gli intervalli di indirizzi IPv4 secondari, che possono essere utilizzati solo da intervalli IP alias. | |
Modalità automatica | allowAutoModeSubnet |
AUTO_MODE_SUBNET_BLOCKED |
La modalità di creazione subnet della rete VPC non può essere impostata sulla modalità automatica. | |
Peering di rete VPC | allowVpcPeering |
VPC_PEERING_BLOCKED |
La rete non supporta il peering di rete VPC. Inoltre, la rete non supporta l'accesso privato ai servizi, che si basa sul peering di rete VPC. | |
Route statiche | allowStaticRoutes |
STATIC_ROUTES_BLOCKED |
La rete non supporta le route statiche. | |
Mirroring pacchetto | allowPacketMirroring |
PACKET_MIRRORING_BLOCKED |
La rete non supporta il Mirroring pacchetto. | |
Cloud NAT | allowCloudNat |
CLOUD_NAT_BLOCKED |
La rete non supporta Cloud NAT. | |
Router Cloud | allowCloudRouter |
CLOUD_ROUTER_BLOCKED |
La rete non supporta la creazione di router Cloud. | |
Cloud Interconnect | allowInterconnect |
INTERCONNECT_BLOCKED |
La rete non supporta Cloud Interconnect. | |
Cloud VPN | allowVpn |
VPN_BLOCKED |
La rete non supporta Cloud VPN. | |
Cloud Load Balancing | allowLoadBalancing |
LOAD_BALANCING_BLOCKED |
La rete non supporta Cloud Load Balancing. Non puoi creare bilanciatori del carico nella rete. Inoltre, non puoi utilizzare Google Cloud Armor nella rete, perché i criteri di sicurezza di Google Cloud Armor si applicano solo ai bilanciatori del carico e alle VM con indirizzi IP esterni. | |
Accesso privato Google | allowPrivateGoogleAccess |
PRIVATE_GOOGLE_ACCESS_BLOCKED |
La rete non supporta l'accesso privato Google. | |
Private Service Connect | allowPsc |
PSC_BLOCKED |
La rete non supporta nessuna configurazione di Private Service Connect. |
Funzionalità aggiuntive che non si applicano al traffico proveniente dalle NIC RDMA
Alcune funzionalità delle normali reti VPC disponibili per il traffico di altri protocolli non si applicano al traffico in una rete con il profilo di rete RDMA, ad esempio:
- Le regole firewall di nuova generazione Cloud non sono supportate.
- Log di flusso VPC non è supportato.
- Connectivity Tests non è supportato.
Anche se Google Cloud non ti impedisce di configurare queste funzionalità, non sono efficaci nelle reti VPC con il profilo di rete RDMA.
Considerazioni sulle prestazioni per più NIC nella stessa rete VPC
Per supportare i carichi di lavoro che traggono vantaggio dalla comunicazione tra GPU tra GPU e GPU, il profilo di rete RDMA consente di creare VM con più NIC MRDMA
collegate alla stessa rete. Tuttavia, la connettività cross-rail potrebbe influire sulle prestazioni della rete, ad esempio attraverso l'aumento della latenza. Le VM con NIC MRDMA
utilizzano NCCL, che tenta di allineare tutti i trasferimenti di rete anche per le comunicazioni cross-rail, ad esempio utilizzando PXN per copiare i dati tramite NVlink in una GPU allineata al binario prima di trasferirli sulla rete.