RDMA RoCE 네트워크 프로필

이 페이지에서는 Google Cloud의 컨버지드 이더넷(RoCE) 네트워크 프로필을 통한 원격 직접 메모리 액세스(RDMA)를 간략하게 설명합니다.

개요

RDMA RoCE 네트워크 프로필에서 RoCE v2 프로토콜을 사용하여 네트워크에 생성된 VM의 GPU 간 지연 시간이 짧고 대역폭이 큰 RDMA 통신을 제공하는 가상 프라이빗 클라우드(VPC) 네트워크를 만들 수 있습니다. RoCE 네트워크 프로필을 사용하는 VPC 네트워크를 RoCE VPC 네트워크라고 합니다.

RoCE VPC 네트워크는 AI 워크로드를 실행하는 데 유용합니다. Google Cloud에서 AI 워크로드를 실행하는 방법에 관한 자세한 내용은 AI 하이퍼컴퓨터 개요를 참조하세요.

RoCE 네트워크 프로필의 리소스 이름은 ZONE-vpc-roce 형식입니다(예: europe-west1-b-vpc-roce). 특정 네트워크 프로필 이름을 보려면 네트워크 프로필 목록을 참조하세요.

지원되는 영역

RoCE 네트워크 프로필은 일부 제한된 영역에서만 사용할 수 있습니다. RoCE VPC 네트워크는 RoCE 네트워크 프로필을 사용할 수 있는 영역에서만 만들 수 있습니다.

지원되는 영역을 보려면 네트워크 프로필 목록을 참조하세요.

또는 RoCE VPC 네트워크에서 만들려는 GPU 머신 유형의 지원되는 영역을 확인할 수 있습니다. RoCE 네트워크 프로필은 사양에 설명된 지원되는 머신 유형과 동일한 영역에서 사용할 수 있습니다. 자세한 내용은 GPU 가용성 리전 및 영역을 참조하세요.

사양

RoCE VPC 네트워크의 사양은 다음과 같습니다.

  • NVIDIA ConnectX NIC. NVIDIA ConnectX NIC는 Google Cloud에서 MRDMA 네트워크 인터페이스로 표시됩니다.

  • 영역 제약 조건. RoCE VPC 네트워크를 사용하는 리소스는 RoCE 네트워크 생성 중에 RoCE VPC 네트워크와 연결된 RoCE 네트워크 프로필과 동일한 영역으로 제한됩니다. 이 영역별 한도는 다음과 같은 영향을 미칩니다.

    • RoCE VPC 네트워크에서 네트워크 인터페이스가 있는 모든 인스턴스는 RoCE VPC 네트워크에서 사용하는 RoCE 네트워크 프로필의 영역과 일치하는 영역에 생성해야 합니다.

    • RoCE VPC 네트워크에서 생성된 모든 서브넷은 RoCE VPC 네트워크에서 사용되는 RoCE 네트워크 프로필의 영역이 포함된 리전에 있어야 합니다.

  • MRDMA 네트워크 인터페이스만 해당 RoCE VPC 네트워크는 MRDMA 네트워크 인터페이스(NIC)만 지원하며, 이 인터페이스는 A3 Ultra, A4, A4X 머신 시리즈에서만 사용할 수 있습니다.

    가상 머신(VM) 인스턴스의 모든 비MRDMA NIC는 일반 VPC 네트워크에 연결되어야 합니다.

  • 8896바이트 MTU 최적의 성능을 위해 RoCE VPC 네트워크의 최대 전송 단위(MTU)8896바이트로 설정하는 것이 좋습니다. 이렇게 하면 VM의 게스트 운영체제에 있는 RDMA 드라이버가 필요한 경우 더 작은 MTU를 사용할 수 있습니다.

    gcloud CLI 또는 API를 사용하여 RoCE VPC 네트워크를 만드는 경우 8896바이트가 기본 MTU입니다. Google Cloud 콘솔을 사용하여 RoCE VPC 네트워크를 만드는 경우 MTU를 8896으로 설정해야 합니다.

  • 방화벽 차이점 RoCE VPC 네트워크는 다른 암시적 방화벽 규칙을 사용합니다. RoCE 방화벽 정책 유형이 있는 리전 네트워크 방화벽 정책만 지원합니다. 지원되는 리전 네트워크 방화벽 정책 내 규칙의 파라미터 집합이 제한됩니다. 자세한 내용은 RoCE VPC 네트워크용 Cloud NGFW를 참조하세요.

  • VPC 흐름 로그 지원 없음 RoCE VPC 네트워크는 RoCE VPC 네트워크의 서브넷에 VPC 흐름 로그를 사용 설정하더라도 VPC 흐름 로그를 지원하지 않습니다.

  • 연결 테스트 지원 없음 연결 테스트는 RoCE VPC 네트워크를 지원하지 않습니다.

  • 기타 VPC 기능 RoCE VPC 네트워크는 제한된 다른 VPC 기능을 지원합니다. 자세한 내용은 다음 지원되는 기능 및 지원되지 않는 기능 섹션을 참조하세요.

지원되는 기능 및 지원되지 않는 기능

다음 표에는 RoCE VPC 네트워크에서 지원되는 VPC 기능이 나열되어 있습니다.

기능 지원됨 네트워크 프로필 속성 네트워크 프로필 속성 값 세부정보
MRDMA NIC interfaceTypes MRDMA

RoCE VPC 네트워크는 MRDMA NIC만 지원하며 GVNIC 또는 VIRTIO_NET와 같은 다른 유형은 지원하지 않습니다.

동일한 네트워크의 멀티 NIC allowMultiNicInSameNetwork MULTI_NIC_IN_SAME_NETWORK_ALLOWED

RoCE VPC 네트워크는 멀티 NIC VM을 지원하므로 두 개 이상의 MRDMA VM NIC가 동일한 RoCE VPC 네트워크에 있을 수 있습니다. 각 NIC는 RoCE VPC 네트워크의 고유한 서브넷에 연결되어야 합니다.

RoCE VPC 네트워크 멀티 NIC 고려사항을 참조하세요.

IPv4 전용 서브넷 subnetworkStackTypes SUBNET_STACK_TYPE_IPV4_ONLY

RoCE VPC 네트워크는 일반 VPC 네트워크와 동일한 유효한 IPv4 범위를 포함하여 IPv4 전용 서브넷을 지원합니다.

RoCE VPC 네트워크는 이중 스택 또는 IPv6 전용 서브넷을 지원하지 않습니다. 자세한 내용은 서브넷 유형을 참조하세요.

PRIVATE 서브넷 용도 subnetworkPurposes SUBNET_PURPOSE_PRIVATE

RoCE VPC 네트워크는 purpose 속성 값이 PRIVATE인 일반 서브넷을 지원합니다.

RoCE VPC 네트워크는 Private Service Connect 서브넷, 프록시 전용 서브넷 또는 Private NAT 서브넷을 지원하지 않습니다. 자세한 내용은 서브넷 용도를 참조하세요.

GCE_ENDPOINT 주소 용도 addressPurposes GCE_ENDPOINT

RoCE VPC 네트워크는 VM NIC의 내부 IP 주소에서 사용되는 GCE_ENDPOINTpurpose 속성 값을 갖는 IP 주소를 지원합니다.

RoCE VPC 네트워크는 SHARED_LOADBALANCER_VIP 용도와 같은 특수 용도의 IP 주소를 지원하지 않습니다. 자세한 내용은 주소 리소스 참조를 참조하세요.

nic0의 연결 allowDefaultNicAttachment DEFAULT_NIC_ATTACHMENT_BLOCKED RoCE VPC 네트워크는 VM의 nic0 네트워크 인터페이스를 네트워크에 연결하는 것을 지원하지 않습니다. RoCE VPC 네트워크에 연결된 각 MRDMA NIC는 nic0이 아니어야 합니다.
VM의 외부 IP 주소 allowExternalIpAccess EXTERNAL_IP_ACCESS_BLOCKED RoCE VPC 네트워크는 MDRMA VM NIC에 외부 IP 주소 할당을 지원하지 않습니다. 따라서 MDRMA VM NIC는 인터넷에 액세스할 수 없습니다.
Dynamic Network Interface allowSubInterfaces SUBINTERFACES_BLOCKED RoCE VPC 네트워크는 Dynamic NIC를 지원하지 않습니다.
별칭 IP 범위 allowAliasIpRanges ALIAS_IP_RANGE_BLOCKED RoCE VPC 네트워크는 MRDMA NIC에 별칭 IP 범위 할당을 지원하지 않습니다.
IP 전달 allowIpForwarding IP_FORWARDING_BLOCKED RoCE VPC 네트워크는 IP 전달을 지원하지 않습니다.
VM 네트워크 마이그레이션 allowNetworkMigration NETWORK_MIGRATION_BLOCKED RoCE VPC 네트워크는 네트워크 간 VM NIC 마이그레이션을 지원하지 않습니다.
자동 모드 allowAutoModeSubnet AUTO_MODE_SUBNET_BLOCKED RoCE VPC 네트워크는 자동 모드 네트워크일 수 없습니다. 자세한 내용은 서브넷 생성 모드를 참조하세요.
VPC 네트워크 피어링 allowVpcPeering VPC_PEERING_BLOCKED RoCE VPC 네트워크는 VPC 네트워크 피어링을 사용하여 다른 VPC 네트워크에 연결하는 것을 지원하지 않습니다. 따라서 RoCE VPC 네트워크는 비공개 서비스 액세스를 사용하여 서비스에 연결하는 것을 지원하지 않습니다.
정적 경로 allowStaticRoutes STATIC_ROUTES_BLOCKED RoCE VPC 네트워크는 정적 경로를 지원하지 않습니다.
패킷 미러링 allowPacketMirroring PACKET_MIRRORING_BLOCKED RoCE VPC 네트워크는 패킷 미러링을 지원하지 않습니다.
Cloud NAT allowCloudNat CLOUD_NAT_BLOCKED RoCE VPC 네트워크는 Cloud NAT를 지원하지 않습니다.
Cloud Router allowCloudRouter CLOUD_ROUTER_BLOCKED RoCE VPC 네트워크는 Cloud Router 및 동적 경로를 지원하지 않습니다.
Cloud Interconnect allowInterconnect INTERCONNECT_BLOCKED RoCE VPC 네트워크는 Cloud Interconnect VLAN 연결을 지원하지 않습니다.
Cloud VPN allowVpn VPN_BLOCKED RoCE VPC 네트워크는 Cloud VPN 터널을 지원하지 않습니다.
Network Connectivity Center allowNcc NCC_BLOCKED RoCE VPC 네트워크는 Network Connectivity Center를 지원하지 않습니다. RoCE VPC 네트워크를 Network Connectivity Center 허브에 VPC 스포크로 추가할 수 없습니다.
Cloud Load Balancing allowLoadBalancing LOAD_BALANCING_BLOCKED RoCE VPC 네트워크는 Cloud Load Balancing을 지원하지 않습니다. 따라서 RoCE VPC 네트워크는 Google Cloud Armor를 비롯한 부하 분산기 기능을 지원하지 않습니다.
비공개 Google 액세스 allowPrivateGoogleAccess PRIVATE_GOOGLE_ACCESS_BLOCKED RoCE VPC 네트워크는 비공개 Google 액세스를 지원하지 않습니다.
Private Service Connect allowPsc PSC_BLOCKED RoCE VPC 네트워크는 Private Service Connect를 지원하지 않습니다.

RoCE VPC 네트워크 멀티 NIC 고려사항

크로스 레일 GPU-GPU 통신을 활용하는 워크로드를 지원하기 위해 RoCE VPC 네트워크는 네트워크에 다중 MRDMA NIC가 있는 VM을 지원합니다. 각 MRDMA NIC는 고유한 서브넷에 있어야 합니다. 동일한 RoCE VPC 네트워크에 MRDMA NIC를 두 개 이상 배치하면 지연 시간 증가 등 네트워크 성능에 영향을 줄 수 있습니다. MRDMA NIC는 NCCL을 사용합니다. NCCL은 크로스 레일 통신의 경우에도 모든 네트워크 전송을 정렬하려고 시도합니다. 예를 들어 PXN을 사용하여 NVlink를 통해 데이터를 레일 정렬 GPU에 복사한 후 네트워크를 통해 전송합니다.

다음 단계