Profil jaringan RDMA

Halaman ini memberikan ringkasan profil jaringan RDMA di Google Cloud.

Tentang profil jaringan RDMA

Profil jaringan RDMA memungkinkan Anda membuat jaringan Virtual Private Cloud (VPC) tempat Anda dapat menjalankan beban kerja AI pada instance VM yang memiliki NIC NVIDIA ConnectX-7. NIC ini mendukung konektivitas remote direct memory access (RDMA) dan memiliki jenis NIC MRDMA di Google Cloud.

Jaringan VPC dengan profil jaringan RDMA mendukung komunikasi RDMA latensi rendah dan bandwidth tinggi antara GPU VM yang dibuat di jaringan menggunakan RDMA melalui converged ethernet v2 (RoCE v2).

Untuk mengetahui informasi selengkapnya tentang cara menjalankan beban kerja AI di Google Cloud, lihat dokumentasi Hypercomputer AI.

Spesifikasi

Jaringan VPC yang dibuat dengan profil jaringan RDMA memiliki spesifikasi berikut:

  • Jaringan hanya menerima lampiran dari NIC MRDMA. VM A3 Ultra adalah satu-satunya jenis VM yang mendukung NIC MRDMA. Jenis NIC lainnya, misalnya GVNICs VM A3 Ultra, harus dilampirkan ke jaringan VPC reguler.
  • Kumpulan fitur yang didukung di jaringan telah dikonfigurasi sebelumnya oleh Google Cloud untuk mendukung beban kerja AI yang berjalan dan memerlukan RDMA. Jaringan VPC dengan profil jaringan RDMA memiliki lebih banyak batasan daripada jaringan VPC reguler. Untuk informasi selengkapnya, lihat Fitur yang didukung dan tidak didukung.
  • Jaringan dibatasi pada zona profil jaringan yang Anda tentukan saat membuat jaringan. Misalnya, setiap instance yang Anda buat di jaringan harus dibuat di zona profil jaringan. Untuk mengetahui informasi selengkapnya, lihat Zona yang didukung. Selain itu, setiap subnet yang Anda buat di jaringan harus berada di region yang sesuai dengan zona profil jaringan.
  • Nama resource profil jaringan RDMA yang Anda tentukan saat membuat jaringan memiliki format ZONE-vpc-roce berikut, misalnya europe-west1-b-vpc-roce.
  • MTU default di jaringan VPC yang dibuat dengan profil jaringan RDMA adalah 8896. Setelan default ini memberi driver RDMA di OS tamu VM fleksibilitas untuk menggunakan MTU yang sesuai. MTU default di jaringan VPC reguler (1460) mungkin terlalu kecil untuk beberapa workload RDMA. Untuk performa terbaik, Google merekomendasikan agar Anda tidak mengubah MTU default.

Zona yang didukung

Profil jaringan RDMA tersedia di zona berikut:

  • europe-west1-b
  • us-east7-c

Fitur yang didukung dan tidak didukung

Bagian ini menjelaskan fitur yang didukung dan tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA.

Fitur jaringan VPC reguler didukung kecuali jika dikonfigurasi untuk dinonaktifkan oleh profil jaringan, bergantung pada fitur yang dinonaktifkan oleh profil jaringan, atau tidak berlaku untuk traffic dari NIC RDMA seperti yang dijelaskan di bagian ini.

Fitur yang dikonfigurasi oleh profil jaringan

Tabel ini mencantumkan fitur spesifik yang dikonfigurasi oleh resource profil jaringan dan menjelaskan apakah fitur tersebut didukung atau tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA. Ini mencakup nilai properti profil jaringan yang ditetapkan oleh Google Cloud.

Fitur Didukung Nama properti Nilai properti Detail
MRDMA NIC interfaceTypes MRDMA

Jaringan hanya mendukung NIC MRDMA yang digunakan oleh VM A3 Ultra.

Jaringan tidak mendukung jenis NIC lainnya, seperti GVNIC atau VIRTIO_NET.

Multi-NIC di jaringan yang sama allowMultiNicInSameNetwork MULTI_NIC_IN_SAME_NETWORK_ALLOWED Jaringan ini mendukung VM multi-NIC, dengan NIC yang berbeda dari VM yang sama dapat menggunakan jaringan VPC yang sama.

Lihat Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama.

Subnet khusus IPv4 allowedSubnetStackTypes SUBNET_STACK_TYPE_IPV4_ONLY

Jaringan ini mendukung subnet khusus IPv4, termasuk rentang IPv4 yang valid yang sama dengan jaringan VPC reguler.

Jaringan tidak mendukung subnet dual-stack atau khusus IPv6. Untuk mengetahui informasi selengkapnya, lihat Jenis subnet.

Tujuan subnet PRIVATE allowedSubnetPurposes SUBNET_PURPOSE_PRIVATE

Jaringan mendukung subnet reguler, yang memiliki tujuan PRIVATE.

Jaringan tidak mendukung subnet Private Service Connect, subnet khusus proxy, atau subnet NAT Pribadi. Untuk mengetahui informasi selengkapnya, lihat Tujuan subnet.

Tujuan alamat GCE_ENDPOINT addressPurposes GCE_ENDPOINT

Jaringan mendukung alamat IP dengan tujuan GCE_ENDPOINT, yang digunakan untuk alamat IP internal yang ditetapkan ke instance VM.

Jaringan tidak mendukung alamat IP tujuan khusus, seperti tujuan SHARED_LOADBALANCER_VIP yang digunakan di Cloud Load Balancing. Untuk informasi selengkapnya, lihat referensi resource alamat.

Alamat IP eksternal untuk VM allowExternalIpAccess EXTERNAL_IP_ACCESS_BLOCKED Jaringan tidak mendukung penetapan alamat IP eksternal ke VM. NIC yang terhubung ke jaringan tidak dapat menjangkau internet publik.
Rentang IP alias allowAliasIpRanges ALIAS_IP_RANGE_BLOCKED Jaringan tidak mendukung penggunaan rentang IP alias, termasuk rentang alamat IPv4 sekunder, yang hanya dapat digunakan oleh rentang IP alias.
Mode otomatis allowAutoModeSubnet AUTO_MODE_SUBNET_BLOCKED Mode pembuatan subnet jaringan VPC tidak dapat disetel ke mode otomatis.
Peering Jaringan VPC allowVpcPeering VPC_PEERING_BLOCKED Jaringan tidak mendukung Peering Jaringan VPC. Selain itu, jaringan tidak mendukung akses layanan pribadi, yang bergantung pada Peering Jaringan VPC.
Rute statis allowStaticRoutes STATIC_ROUTES_BLOCKED Jaringan tidak mendukung rute statis.
Duplikasi Paket allowPacketMirroring PACKET_MIRRORING_BLOCKED Jaringan tidak mendukung Duplikasi Paket.
Cloud NAT allowCloudNat CLOUD_NAT_BLOCKED Jaringan tidak mendukung Cloud NAT.
Cloud Router allowCloudRouter CLOUD_ROUTER_BLOCKED Jaringan tidak mendukung pembuatan Cloud Router.
Cloud Interconnect allowInterconnect INTERCONNECT_BLOCKED Jaringan tidak mendukung Cloud Interconnect.
Cloud VPN allowVpn VPN_BLOCKED Jaringan tidak mendukung Cloud VPN.
Cloud Load Balancing allowLoadBalancing LOAD_BALANCING_BLOCKED Jaringan tidak mendukung Cloud Load Balancing. Anda tidak dapat membuat load balancer di jaringan. Selain itu, Anda tidak dapat menggunakan Google Cloud Armor di jaringan, karena kebijakan keamanan Google Cloud Armor hanya berlaku untuk load balancer dan VM dengan alamat IP eksternal.
Akses Google Pribadi allowPrivateGoogleAccess PRIVATE_GOOGLE_ACCESS_BLOCKED Jaringan tidak mendukung Akses Google Pribadi.
Private Service Connect allowPsc PSC_BLOCKED Jaringan tidak mendukung konfigurasi Private Service Connect apa pun.

Fitur tambahan yang tidak berlaku untuk traffic dari NIC RDMA

Karena RDMA adalah traffic lapisan 2, beberapa fitur jaringan VPC reguler yang tersedia untuk traffic protokol lain tidak berlaku untuk traffic di jaringan dengan profil jaringan RDMA, seperti berikut:

Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama

Untuk mendukung beban kerja yang mendapatkan manfaat dari komunikasi GPU-ke-GPU lintas-jalur, profil jaringan RDMA memungkinkan Anda membuat VM yang memiliki beberapa NIC MRDMA yang terhubung ke jaringan yang sama. Namun, konektivitas lintas-jalur dapat memengaruhi performa jaringan, seperti melalui peningkatan latensi. VM yang memiliki NIC MRDMA menggunakan NCCL, yang mencoba menyelaraskan semua transfer jaringan bahkan untuk komunikasi lintas-jalur, misalnya dengan menggunakan PXN untuk menyalin data melalui NVlink ke GPU yang diselaraskan dengan rel sebelum mentransfer melalui jaringan.

Langkah selanjutnya