Profil jaringan RDMA
Halaman ini memberikan ringkasan profil jaringan RDMA di Google Cloud.
Tentang profil jaringan RDMA
Profil jaringan RDMA memungkinkan Anda membuat jaringan Virtual Private Cloud (VPC)
tempat Anda dapat menjalankan beban kerja AI pada instance VM yang memiliki
NIC NVIDIA ConnectX-7. NIC ini mendukung konektivitas remote direct memory access (RDMA)
dan memiliki jenis NIC MRDMA
di Google Cloud.
Jaringan VPC dengan profil jaringan RDMA mendukung komunikasi RDMA latensi rendah dan bandwidth tinggi antara GPU VM yang dibuat di jaringan menggunakan RDMA melalui converged ethernet v2 (RoCE v2).
Untuk mengetahui informasi selengkapnya tentang cara menjalankan beban kerja AI di Google Cloud, lihat dokumentasi Hypercomputer AI.
Spesifikasi
Jaringan VPC yang dibuat dengan profil jaringan RDMA memiliki spesifikasi berikut:
- Jaringan hanya menerima lampiran dari NIC
MRDMA
. VM A3 Ultra adalah satu-satunya jenis VM yang mendukung NICMRDMA
. Jenis NIC lainnya, misalnya GVNICs VM A3 Ultra, harus dilampirkan ke jaringan VPC reguler. - Kumpulan fitur yang didukung di jaringan telah dikonfigurasi sebelumnya oleh Google Cloud untuk mendukung beban kerja AI yang berjalan dan memerlukan RDMA. Jaringan VPC dengan profil jaringan RDMA memiliki lebih banyak batasan daripada jaringan VPC reguler. Untuk informasi selengkapnya, lihat Fitur yang didukung dan tidak didukung.
- Jaringan dibatasi pada zona profil jaringan yang Anda tentukan saat membuat jaringan. Misalnya, setiap instance yang Anda buat di jaringan harus dibuat di zona profil jaringan. Untuk mengetahui informasi selengkapnya, lihat Zona yang didukung. Selain itu, setiap subnet yang Anda buat di jaringan harus berada di region yang sesuai dengan zona profil jaringan.
- Nama resource profil jaringan RDMA yang Anda tentukan saat membuat jaringan memiliki format
ZONE-vpc-roce
berikut, misalnyaeurope-west1-b-vpc-roce
. - MTU default di jaringan VPC yang dibuat dengan profil jaringan
RDMA adalah
8896
. Setelan default ini memberi driver RDMA di OS tamu VM fleksibilitas untuk menggunakan MTU yang sesuai. MTU default di jaringan VPC reguler (1460
) mungkin terlalu kecil untuk beberapa workload RDMA. Untuk performa terbaik, Google merekomendasikan agar Anda tidak mengubah MTU default.
Zona yang didukung
Profil jaringan RDMA tersedia di zona berikut:
europe-west1-b
us-east7-c
Fitur yang didukung dan tidak didukung
Bagian ini menjelaskan fitur yang didukung dan tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA.
Fitur jaringan VPC reguler didukung kecuali jika dikonfigurasi untuk dinonaktifkan oleh profil jaringan, bergantung pada fitur yang dinonaktifkan oleh profil jaringan, atau tidak berlaku untuk traffic dari NIC RDMA seperti yang dijelaskan di bagian ini.
Fitur yang dikonfigurasi oleh profil jaringan
Tabel ini mencantumkan fitur spesifik yang dikonfigurasi oleh resource profil jaringan dan menjelaskan apakah fitur tersebut didukung atau tidak didukung di jaringan VPC yang dibuat dengan profil jaringan RDMA. Ini mencakup nilai properti profil jaringan yang ditetapkan oleh Google Cloud.
Fitur | Didukung | Nama properti | Nilai properti | Detail |
---|---|---|---|---|
MRDMA NIC |
interfaceTypes |
MRDMA |
Jaringan hanya mendukung NIC Jaringan tidak mendukung jenis NIC lainnya, seperti |
|
Multi-NIC di jaringan yang sama | allowMultiNicInSameNetwork |
MULTI_NIC_IN_SAME_NETWORK_ALLOWED |
Jaringan ini mendukung VM multi-NIC, dengan NIC yang berbeda dari VM yang sama dapat menggunakan jaringan VPC yang sama.
Lihat Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama. |
|
Subnet khusus IPv4 | allowedSubnetStackTypes |
SUBNET_STACK_TYPE_IPV4_ONLY |
Jaringan ini mendukung subnet khusus IPv4, termasuk rentang IPv4 yang valid yang sama dengan jaringan VPC reguler. Jaringan tidak mendukung subnet dual-stack atau khusus IPv6. Untuk mengetahui informasi selengkapnya, lihat Jenis subnet. |
|
Tujuan subnet PRIVATE |
allowedSubnetPurposes |
SUBNET_PURPOSE_PRIVATE |
Jaringan mendukung subnet reguler, yang memiliki tujuan
Jaringan tidak mendukung subnet Private Service Connect, subnet khusus proxy, atau subnet NAT Pribadi. Untuk mengetahui informasi selengkapnya, lihat Tujuan subnet. |
|
Tujuan alamat GCE_ENDPOINT |
addressPurposes |
GCE_ENDPOINT |
Jaringan mendukung alamat IP dengan tujuan Jaringan tidak mendukung alamat IP tujuan khusus, seperti tujuan |
|
Alamat IP eksternal untuk VM | allowExternalIpAccess |
EXTERNAL_IP_ACCESS_BLOCKED |
Jaringan tidak mendukung penetapan alamat IP eksternal ke VM. NIC yang terhubung ke jaringan tidak dapat menjangkau internet publik. | |
Rentang IP alias | allowAliasIpRanges |
ALIAS_IP_RANGE_BLOCKED |
Jaringan tidak mendukung penggunaan rentang IP alias, termasuk rentang alamat IPv4 sekunder, yang hanya dapat digunakan oleh rentang IP alias. | |
Mode otomatis | allowAutoModeSubnet |
AUTO_MODE_SUBNET_BLOCKED |
Mode pembuatan subnet jaringan VPC tidak dapat disetel ke mode otomatis. | |
Peering Jaringan VPC | allowVpcPeering |
VPC_PEERING_BLOCKED |
Jaringan tidak mendukung Peering Jaringan VPC. Selain itu, jaringan tidak mendukung akses layanan pribadi, yang bergantung pada Peering Jaringan VPC. | |
Rute statis | allowStaticRoutes |
STATIC_ROUTES_BLOCKED |
Jaringan tidak mendukung rute statis. | |
Duplikasi Paket | allowPacketMirroring |
PACKET_MIRRORING_BLOCKED |
Jaringan tidak mendukung Duplikasi Paket. | |
Cloud NAT | allowCloudNat |
CLOUD_NAT_BLOCKED |
Jaringan tidak mendukung Cloud NAT. | |
Cloud Router | allowCloudRouter |
CLOUD_ROUTER_BLOCKED |
Jaringan tidak mendukung pembuatan Cloud Router. | |
Cloud Interconnect | allowInterconnect |
INTERCONNECT_BLOCKED |
Jaringan tidak mendukung Cloud Interconnect. | |
Cloud VPN | allowVpn |
VPN_BLOCKED |
Jaringan tidak mendukung Cloud VPN. | |
Cloud Load Balancing | allowLoadBalancing |
LOAD_BALANCING_BLOCKED |
Jaringan tidak mendukung Cloud Load Balancing. Anda tidak dapat membuat load balancer di jaringan. Selain itu, Anda tidak dapat menggunakan Google Cloud Armor di jaringan, karena kebijakan keamanan Google Cloud Armor hanya berlaku untuk load balancer dan VM dengan alamat IP eksternal. | |
Akses Google Pribadi | allowPrivateGoogleAccess |
PRIVATE_GOOGLE_ACCESS_BLOCKED |
Jaringan tidak mendukung Akses Google Pribadi. | |
Private Service Connect | allowPsc |
PSC_BLOCKED |
Jaringan tidak mendukung konfigurasi Private Service Connect apa pun. |
Fitur tambahan yang tidak berlaku untuk traffic dari NIC RDMA
Karena RDMA adalah traffic lapisan 2, beberapa fitur jaringan VPC reguler yang tersedia untuk traffic protokol lain tidak berlaku untuk traffic di jaringan dengan profil jaringan RDMA, seperti berikut:
Pertimbangan performa untuk multi-NIC di jaringan VPC yang sama
Untuk mendukung beban kerja yang mendapatkan manfaat dari komunikasi GPU-ke-GPU lintas-jalur, profil jaringan RDMA memungkinkan Anda membuat VM yang memiliki beberapa NIC MRDMA
yang terhubung ke jaringan yang sama. Namun, konektivitas lintas-jalur
dapat memengaruhi performa jaringan, seperti melalui
peningkatan latensi. VM yang memiliki NIC MRDMA
menggunakan NCCL,
yang mencoba menyelaraskan semua transfer jaringan bahkan untuk komunikasi lintas-jalur, misalnya dengan menggunakan PXN untuk menyalin data melalui NVlink ke
GPU yang diselaraskan dengan rel sebelum mentransfer melalui jaringan.