Profilo di rete RDMA

Questa pagina fornisce una panoramica del profilo di rete RDMA in Google Cloud.

Informazioni sul profilo di rete RDMA

Il profilo di rete RDMA consente di creare una rete Virtual Private Cloud (VPC) in cui è possibile eseguire carichi di lavoro di IA su istanze VM dotate di NIC NVIDIA ConnectX. Queste NIC supportano la connettività RDMA (remote Direct Memory Access) e hanno il tipo di NIC MRDMA in Google Cloud.

Una rete VPC con il profilo di rete RDMA supporta la comunicazione RDMA a bassa latenza e a elevata larghezza di banda tra le GPU delle VM create nella rete utilizzando RDMA su Ethernet convergente v2 (RoCE v2).

Per saperne di più sull'esecuzione di carichi di lavoro IA in Google Cloud, consulta la documentazione sull'ipercomputer IA.

Specifiche

Le reti VPC create con il profilo di rete RDMA hanno le seguenti specifiche:

  • La rete accetta solo allegati da NIC MRDMA. Le VM A3 Ultra e le VM A4 sono gli unici tipi di VM che supportano le NIC MRDMA. Altri tipi di NIC, ad esempio le GVNIC di una VM A3 Ultra, devono essere collegati a una normale rete VPC.
  • L'insieme di funzionalità supportate nella rete è preconfigurato daGoogle Cloud per supportare l'esecuzione di carichi di lavoro IA che richiedono RDMA. Le reti VPC con il profilo di rete RDMA hanno più vincoli rispetto alle normali reti VPC. Per maggiori informazioni, vedi Funzionalità supportate e non supportate.
  • La rete è vincolata alla zona del profilo di rete specificata quando crei la rete. Ad esempio, tutte le istanze create nella rete devono essere create nella zona del profilo di rete. Inoltre, tutte le subnet create nella rete devono trovarsi nella regione corrispondente alla zona del profilo di rete.

    Il profilo di rete RDMA non è disponibile in tutte le zone. Per visualizzare le zone in cui è disponibile il profilo di rete, consulta Zone supportate. Puoi anche visualizzare le istanze del profilo di rete specifiche per zona disponibili elencando i profili di rete.

  • Il nome della risorsa del profilo di rete RDMA specificato durante la creazione della rete ha il formato ZONE-vpc-roce, ad esempio europe-west1-b-vpc-roce.

  • La MTU predefinita in una rete VPC creata con il profilo di rete RDMA è 8896. Questa impostazione predefinita offre al driver RDMA nel sistema operativo guest della VM la flessibilità di utilizzare una MTU appropriata. La MTU predefinita nelle reti VPC normali potrebbe essere troppo piccola per alcuni carichi di lavoro RDMA. Per prestazioni ottimali, Google consiglia di non modificare la MTU predefinita.

Zone supportate

Il profilo di rete RDMA è disponibile nelle zone seguenti:

  • europe-west1-b
  • us-central1-a
  • us-central1-b
  • us-east4-b
  • us-west1-c

Funzionalità supportate e non supportate

Questa sezione descrive le funzionalità supportate e non supportate nelle reti VPC create con il profilo di rete RDMA.

Le funzionalità delle reti VPC normali sono supportate a meno che non siano configurate per essere disattivate dal profilo di rete, dipendono da una funzionalità disabilitata dal profilo di rete o non si applicano al traffico proveniente dalle NIC RDMA, come descritto in questa sezione.

Funzionalità configurate dal profilo di rete

Questa tabella elenca le funzionalità specifiche configurate dalla risorsa del profilo di rete e descrive se sono supportate o meno nelle reti VPC create con il profilo di rete RDMA. Include i valori delle proprietà del profilo di rete impostati da Google Cloud.

Funzionalità Supportato Nome proprietà Valore della proprietà Dettagli
MRDMA NIC interfaceTypes MRDMA

La rete supporta solo MRDMA NIC.

La rete non supporta altri tipi di NIC, come GVNIC o VIRTIO_NET.

NIC multipli nella stessa rete allowMultiNicInSameNetwork MULTI_NIC_IN_SAME_NETWORK_ALLOWED La rete supporta VM con più NIC in cui più NIC della stessa VM possono essere collegate alla stessa rete VPC. Tuttavia, le NIC devono essere collegate a subnet diverse della rete.

Consulta Considerazioni sulle prestazioni per più NIC nella stessa rete VPC.

Subnet solo IPv4 allowedSubnetStackTypes SUBNET_STACK_TYPE_IPV4_ONLY

La rete supporta subnet solo IPv4, inclusi gli stessi intervalli IPv4 validi delle normali reti VPC.

La rete non supporta le subnet solo IPv6 o a doppio stack. Per ulteriori informazioni, consulta Tipi di subnet.

PRIVATE scopo della subnet allowedSubnetPurposes SUBNET_PURPOSE_PRIVATE

La rete supporta subnet normali, che hanno uno scopo di PRIVATE.

La rete non supporta le subnet Private Service Connect, solo le subnet solo proxy o le subnet Private NAT. Per saperne di più, consulta Scopi delle subnet.

Scopo dell'indirizzo GCE_ENDPOINT addressPurposes GCE_ENDPOINT

La rete supporta gli indirizzi IP con lo scopo GCE_ENDPOINT, che viene utilizzato per gli indirizzi IP interni assegnati alle istanze VM.

La rete non supporta indirizzi IP per scopi speciali, ad esempio lo scopo SHARED_LOADBALANCER_VIP utilizzato in Cloud Load Balancing. Per ulteriori informazioni, consulta le risorse di riferimento.

Indirizzi IP esterni per le VM allowExternalIpAccess EXTERNAL_IP_ACCESS_BLOCKED La rete non supporta l'assegnazione di indirizzi IP esterni alle VM. Le NIC connesse alla rete non riescono a raggiungere la rete internet pubblica.
Intervalli IP alias allowAliasIpRanges ALIAS_IP_RANGE_BLOCKED La rete non supporta l'utilizzo di intervalli IP alias, inclusi gli intervalli di indirizzi IPv4 secondari, che possono essere utilizzati solo da intervalli IP alias.
Modalità automatica allowAutoModeSubnet AUTO_MODE_SUBNET_BLOCKED La modalità di creazione subnet della rete VPC non può essere impostata sulla modalità automatica.
Peering di rete VPC allowVpcPeering VPC_PEERING_BLOCKED La rete non supporta il peering di rete VPC. Inoltre, la rete non supporta l'accesso privato ai servizi, che si basa sul peering di rete VPC.
Route statiche allowStaticRoutes STATIC_ROUTES_BLOCKED La rete non supporta le route statiche.
Mirroring pacchetto allowPacketMirroring PACKET_MIRRORING_BLOCKED La rete non supporta il Mirroring pacchetto.
Cloud NAT allowCloudNat CLOUD_NAT_BLOCKED La rete non supporta Cloud NAT.
Router Cloud allowCloudRouter CLOUD_ROUTER_BLOCKED La rete non supporta la creazione di router Cloud.
Cloud Interconnect allowInterconnect INTERCONNECT_BLOCKED La rete non supporta Cloud Interconnect.
Cloud VPN allowVpn VPN_BLOCKED La rete non supporta Cloud VPN.
Cloud Load Balancing allowLoadBalancing LOAD_BALANCING_BLOCKED La rete non supporta Cloud Load Balancing. Non puoi creare bilanciatori del carico nella rete. Inoltre, non puoi utilizzare Google Cloud Armor nella rete, perché i criteri di sicurezza di Google Cloud Armor si applicano solo ai bilanciatori del carico e alle VM con indirizzi IP esterni.
Accesso privato Google allowPrivateGoogleAccess PRIVATE_GOOGLE_ACCESS_BLOCKED La rete non supporta l'accesso privato Google.
Private Service Connect allowPsc PSC_BLOCKED La rete non supporta nessuna configurazione di Private Service Connect.

Funzionalità aggiuntive che non si applicano al traffico proveniente dalle NIC RDMA

Alcune funzionalità delle normali reti VPC disponibili per il traffico di altri protocolli non si applicano al traffico in una rete con il profilo di rete RDMA, ad esempio:

Anche se Google Cloud non ti impedisce di configurare queste funzionalità, non sono efficaci nelle reti VPC con il profilo di rete RDMA.

Considerazioni sulle prestazioni per più NIC nella stessa rete VPC

Per supportare i carichi di lavoro che traggono vantaggio dalla comunicazione tra GPU tra GPU e GPU, il profilo di rete RDMA consente di creare VM con più NIC MRDMA collegate alla stessa rete. Tuttavia, la connettività cross-rail potrebbe influire sulle prestazioni della rete, ad esempio attraverso l'aumento della latenza. Le VM con NIC MRDMA utilizzano NCCL, che tenta di allineare tutti i trasferimenti di rete anche per le comunicazioni cross-rail, ad esempio utilizzando PXN per copiare i dati tramite NVlink in una GPU allineata al binario prima di trasferirli sulla rete.

Passaggi successivi