가속기 최적화 머신 계열은 Google Cloud가 인공지능(AI), 머신러닝(ML), 고성능 컴퓨팅(HPC)과 같은 GPU 가속 워크로드에 필요한 성능과 효율성을 제공하도록 설계되었습니다.
가속기 최적화 머신 계열은 A3, A2, G2 머신 시리즈에서 사용할 수 있습니다. 한 시리즈의 각 머신 유형에는 특정 모델과 연결된 여러 NVIDIA GPU가 있습니다. N1 범용 머신 유형에 일부 GPU 모델을 연결할 수도 있습니다.
워크로드 유형별 머신 시리즈 권장사항
다음 섹션에서는 GPU 워크로드에 따라 권장되는 머신 시리즈를 제공합니다.
대규모 AI 모델
워크로드 유형 | 적합한 분야 | 좋은 대안 |
---|---|---|
다중(분산) 서버 학습 | A3 Mega | A3 High, A2 |
추론 | A3 High, A3 Edge | A2 |
대규모 모델 및 학습을 실행하기 위해 클러스터를 프로비저닝하려면 대규모 모델 학습 및 미세 조정 실행을 참조하세요.
주류 모델
워크로드 유형 | 적합한 분야 | 좋은 대안(추천순) |
---|---|---|
다중(분산) 서버 학습 | A3 Mega, A3 High |
|
단일 서버 학습 | A3 High, A3 Edge |
|
추론 | A3 Edge, G2 |
|
주류 모델을 실행하기 위해 클러스터를 프로비저닝하려면 주류 모델 학습 및 미세 조정 실행을 참조하세요.
그래픽 집약적인 워크로드
워크로드 유형 | 가장 적합(추천순) |
---|---|
동영상 스트리밍 및 트랜스코딩, 원격 가상 워크스테이션, 디지털 트윈 |
|
그래픽 집약적인 워크로드에 맞게 VM을 프로비저닝하려면 이 옵션을 검토하세요.
고성능 컴퓨팅
고성능 컴퓨팅 워크로드의 경우 가속기 최적화 머신 시리즈가 모두 적합합니다. 가장 적합한 방법은 GPU로 오프로드해야 하는 계산량에 따라 다릅니다.
가격 책정 및 할인
모든 가속기 최적화 머신 유형은 다음과 같은 할인 및 소비 옵션을 지원합니다.
가속기 최적화 머신 유형은 연결된 GPU, 사전 정의된 vCPU, 메모리, 번들 로컬 SSD(해당하는 경우)에 대한 요금이 청구됩니다. 가속기 최적화 VM의 가격 책정 정보는 VM 인스턴스 가격 책정 페이지의 가속기 최적화 머신 유형 계열 섹션을 참조하세요.
A3 머신 시리즈
A3 머신 시리즈에는 vCPU 208개와 1,872GB의 메모리가 있습니다. 이 머신 시리즈는 컴퓨팅 및 메모리 집약적이고 네트워크에 결합된 ML 학습, HPC 워크로드에 최적화되어 있습니다.
A3 머신 시리즈는 다음 기능도 제공합니다.
차세대 하드웨어: 각 A3 머신 유형에는 GPU당 80GB의 GPU 메모리를 제공하고 대규모 Transformer 기반 언어 모델, 데이터베이스, HPC에 적합한 NVIDIA H100 SXM GPU가 연결되어 있습니다.
이 머신 시리즈는 4세대 인텔 제온 스케일러블 프로세서(Sapphire Rapids)를 기반으로 하며 최대 3.3GHz의 지속형 단일 코어 최대 터보 주파수를 제공합니다.
업계 최고의 NVLink 확장: NVIDIA H100 GPU는 단방향으로 450GB/초의 최대 GPU NVLink 대역폭을 제공합니다. 시스템의 GPU 8개 간에 전체 NVLink 토폴로지를 사용할 경우 집계 NVLink 대역폭은 최대 7.2TB/초입니다. 이러한 GPU는 통합 메모리 공간이 있는 단일 고성능 가속기로 사용되어 최대 25페타플롭의 AI/DL/ML 컴퓨팅 성능과 최대 50페타플롭의 추론 컴퓨팅 성능을 제공합니다.
향상된 컴퓨팅 속도 및 네트워킹: A3 머신 계열은 이전 세대 A2 머신 계열에 비해 네트워킹 속도가 최대 2.5배 향상됩니다. 네트워킹에 관한 자세한 내용은 네트워킹 및 A3 머신 시리즈를 참고하세요.
가상화 최적화: A3 VM의 PCIe(Peripheral Component Interconnect Express) 토폴로지는 워크로드가 데이터 전송을 최적화하는 데 사용할 수 있는 보다 정확한 지역 정보를 제공합니다.
또한 NVIDIA H100 GPU는 장애의 단계적 복구를 위한 함수 수준 재설정(FLR)과 특정 시나리오의 동시 실행 개선을 위한 원자적 작업 지원을 제공합니다.
스토리지: A3 머신 유형을 사용하여 생성된 VM에 6,000GiB의 로컬 SSD가 자동으로 추가됩니다. 로컬 SSD를 빠른 스크래치 디스크로 사용하거나 I/O 병목 현상을 방지하면서 GPU에 데이터를 공급하는 데 사용할 수 있습니다.
더 높은 스토리지 성능을 필요로 하는 애플리케이션의 경우 이 시리즈의 머신 유형에 최대 257TiB까지 영구 디스크 스토리지를 연결할 수 있습니다.
압축 배치 정책 지원: 데이터 센터 내 VM의 실제 배치를 더 세부적으로 제어할 수 있습니다. 이렇게 하면 단일 가용성 영역 내에서 VM 배치의 지연 시간이 단축되고 대역폭이 증가합니다. 압축 배치 정책은 지정된 영역 내에서 네트워크의 지연 시간이 짧은 하위 집합에 최대 96개의 VM을 지원합니다. 자세한 내용은 압축 배치 정책을 사용하여 지연 시간 감소를 참조하세요.
A3 머신 시리즈에는 다음과 같은 머신 유형을 사용할 수 있습니다.
A3 Mega 머신 유형
머신 유형 | GPU 수 | GPU 메모리* (GB HBM3) |
vCPU 수† | VM 메모리(GB) | 연결된 로컬 SSD(GiB) | 물리적 NIC 수 | 최대 네트워크 대역폭(Gbps)‡ | 네트워크 프로토콜 |
---|---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 9 | 1,800 | GPUDirect-TCPXO |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
A3 High 머신 유형
a3-highgpu-1g
, a3-highgpu-2g
또는 a3-highgpu-4g
머신 유형을 프로비저닝할 때는 스팟 VM을 사용하거나 MIG의 크기 조절 요청과 같이 동적 워크로드 스케줄러 (DWS)를 사용하는 기능을 사용해야 합니다. 이러한 옵션에 관한 자세한 안내는 다음을 검토하세요.
- Spot VM을 만들려면 가속기 최적화 VM 만들기를 참고하고 프로비저닝 모델을
SPOT
로 설정하세요. - 동적 워크로드 스케줄러를 사용하는 MIG에서 크기 조절 요청을 만들려면 GPU VM으로 MIG 만들기를 참고하세요.
머신 유형 | GPU 수 | GPU 메모리* (GB HBM3) |
vCPU 수† | VM 메모리(GB) | 연결된 로컬 SSD(GiB) | 물리적 NIC 수 | 최대 네트워크 대역폭(Gbps)‡ | 네트워크 프로토콜 |
---|---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 | GPUDirect-TCPX |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1,500 | 1 | 50 | GPUDirect-TCPX |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3,000 | 1 | 100 | GPUDirect-TCPX |
a3-highgpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 5 | 1,000 | GPUDirect-TCPX |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
A3 Edge 머신 유형
머신 유형 | GPU 수 | GPU 메모리* (GB HBM3) |
vCPU 수† | VM 메모리(GB) | 연결된 로컬 SSD(GiB) | 물리적 NIC 수 | 최대 네트워크 대역폭(Gbps)‡ | 네트워크 프로토콜 |
---|---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 5 |
|
GPUDirect-TCPX |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
A3 시리즈에 지원되는 디스크 유형
A3 VM은 다음 블록 스토리지 유형을 사용할 수 있습니다.
- 균형 있는 영구 디스크(
pd-balanced
) - SSD(성능) 영구 디스크(
pd-ssd
) - 하이퍼디스크 균형 (
hyperdisk-balanced
): 하이퍼디스크 균형은a3-megagpu-8g
,a3-highgpu-8g
,a3-edgegpu-8g
및 머신 유형에서만 지원됩니다. - Hyperdisk ML(
hyperdisk-ml
) - 하이퍼디스크 익스트림(
hyperdisk-extreme
) - 하이퍼디스크 처리량(
hyperdisk-throughput
) - 로컬 SSD: A3 머신 유형을 사용하여 생성된 VM에 자동으로 추가됨
A3 Mega
VM당 최대 디스크 수* | ||||||
---|---|---|---|---|---|---|
머신 유형 |
모든 디스크† | 하이퍼디스크 균형 | 하이퍼디스크 처리량 | Hyperdisk ML | 하이퍼디스크 익스트림 | 연결된 로컬 SSD 디스크 |
a3-megagpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 High
VM당 최대 디스크 수* | ||||||
---|---|---|---|---|---|---|
머신 유형 |
모든 디스크† | 하이퍼디스크 균형 | 하이퍼디스크 처리량 | Hyperdisk ML | 하이퍼디스크 익스트림 | 연결된 로컬 SSD 디스크 |
a3-highgpu-1g |
128 | 해당 사항 없음 | 64 | 64 | 해당 사항 없음 | 2 |
a3-highgpu-2g |
128 | 해당 사항 없음 | 64 | 64 | 해당 사항 없음 | 4 |
a3-highgpu-4g |
128 | 해당 사항 없음 | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 Edge
VM당 최대 디스크 수* | ||||||
---|---|---|---|---|---|---|
머신 유형 | 모든 디스크† | 하이퍼디스크 균형 | 하이퍼디스크 처리량 | Hyperdisk ML | 하이퍼디스크 익스트림 | 연결된 로컬 SSD |
a3-edgegpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
*하이퍼디스크 및 영구 디스크 사용 요금은 머신 유형 가격 책정과 별도로 청구됩니다. 디스크 가격은 영구 디스크 및 하이퍼디스크 가격 책정을 참조하세요.
†이 한도는 영구 디스크 및 하이퍼디스크에 적용되지만 로컬 SSD 디스크는 포함되지 않습니다.
디스크 및 용량 한도
영구 디스크와 하이퍼디스크 볼륨을 혼합하여 VM에 사용할 수 있지만 다음과 같은 제한사항이 적용됩니다.
- 하이퍼디스크 및 영구 디스크 볼륨 수의 합계는 VM당 128개를 초과할 수 없습니다.
모든 디스크 유형에서 최대 총 디스크 용량(TiB)은 다음을 초과할 수 없습니다.
vCPU가 32개 미만인 머신 유형:
- 모든 하이퍼디스크 또는 모든 영구 디스크 257TiB
- 하이퍼디스크와 영구 디스크의 조합 257TiB
vCPU가 32개 이상인 머신 유형:
- 모든 하이퍼디스크 512TiB
- 하이퍼디스크 및 영구 디스크의 조합 512TiB
- 모든 영구 디스크 257TiB
용량 한도에 관한 자세한 내용은 VM당 하이퍼디스크 용량 한도 및 영구 디스크 최대 용량을 참조하세요.
네트워킹 및 A3 머신 시리즈
A3 머신 시리즈는 A2 머신 시리즈에 비해 컴퓨팅 속도가 최대 2.5배 향상됩니다. a3-highgpu-8g
머신 유형은 이전 세대 A2 머신 유형에 비해 네트워크 대역폭이 10배 더 넓습니다.
a3-megagpu-8g
머신 유형은 a3-highgpu-8g
에 비해 2배의 네트워크 대역폭을 제공하고 A2 머신 유형에 비해 20배의 네트워크 대역폭을 제공합니다.
- 단일 NIC A3 VM: GPU가 1~4개 연결된 A3 VM의 경우 단일 물리적 네트워크 인터페이스 카드 (NIC)만 사용할 수 있습니다.
- 다중 NIC A3 VM: GPU 8개가 연결된 A3 VM의 경우 여러 개의 물리적 NIC를 사용할 수 있습니다. 이러한 A3 머신 유형의 경우 NIC는 PCIe (Peripheral Component Interconnect Express) 버스에서 다음과 같이 배열됩니다.
- A3 Mega 머신 유형: 8+1의 NIC 배열을 사용할 수 있습니다. 이렇게 구성하면 8개의 NIC가 동일한 PCIe 버스를 공유하며, 1개의 NIC가 별도의 PCIe 버스에 상주합니다.
- A3 High 머신 유형: 4+1의 NIC 배열을 사용할 수 있습니다. 이렇게 구성하면 4개의 NIC가 동일한 PCIe 버스를 공유하며, 1개의 NIC가 별도의 PCIe 버스에 상주합니다.
- A3 Edge 머신 유형 머신 유형: 4+1의 NIC 배열을 사용할 수 있습니다. 이렇게 구성하면 4개의 NIC가 동일한 PCIe 버스를 공유하며, 1개의 NIC가 별도의 PCIe 버스에 상주합니다. 이러한 5개의 NIC는 각 VM에 총 400Gbps의 네트워크 대역폭을 제공합니다.
동일한 PCIe 버스를 공유하는 NIC는 NVIDIA H100 80GB GPU 2개당 NIC 1개의 비균일 메모리 액세스(NUMA) 정렬을 갖습니다. 이러한 NIC는 전용 고대역폭 GPU 간 통신에 적합합니다. 별도의 PCIe 버스에 있는 물리적 NIC는 다른 네트워킹 요구사항에 적합합니다.
네트워크 프로토콜
A3 머신 계열은 GPUDirect-TCPX 및 GPUDirect-TCPXO를 통해 GPU 클러스터 성능을 개선합니다.
- A3 Edge 및 A3 High 머신 유형의 경우 GPUDirect-TCPX는 데이터 패킷 페이로드가 GPU 메모리에서 네트워크 인터페이스로 직접 전송될 수 있게 하여 네트워크 성능을 향상시킵니다.
a3-highgpu-8g
머신 유형은 GPUDirect-TCPX를 활용하여 A2 또는 G2 가속기 최적화 머신 유형과 비교했을 때 클러스터의 VM 간 처리량이 훨씬 더 높습니다. - A3 Mega 머신 유형의 경우 GPUDirect-TCPXO는 TCP 프로토콜 처리를 SmartNIC의 ACC 코어로 오프로드하여 GPUDirect-TCPX를 더욱 개선합니다. GPUDirect-TCPXO를 활용하면
a3-megagpu-8g
머신 유형의 네트워크 대역폭이a3-highgpu-8g
머신 유형에 비해 두 배가 됩니다.
A3 시리즈의 제한사항
A3 Edge, A3 High, A3 Mega 머신 유형을 사용하는 VM에는 다음 제한사항이 적용됩니다.
- A3 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A3 머신 유형을 사용할 수 있습니다.
- A3 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- A3 머신 계열은 Sapphire Rapids 플랫폼에서만 사용할 수 있습니다.
- VM에서 A3 머신 유형을 사용하는 경우에는 머신 유형을 변경할 수 없습니다. 머신 유형을 변경해야 하는 경우에는 새 VM을 만들어야 합니다.
- VM 머신 유형을 A3 머신 유형으로 변경할 수 없습니다. A3 머신 유형을 사용하는 VM이 필요하면 새 VM을 만들어야 합니다.
- A3 머신 유형은 단독 테넌시를 지원하지 않습니다.
- A3 머신 유형에서는 Windows 운영체제를 실행할 수 없습니다.
- 특정 예약을 통해서만 A3 머신 유형을 예약할 수 있습니다.
a3-highgpu-1g
,a3-highgpu-2g
,a3-highgpu-4g
머신 유형의 경우 다음과 같은 제한사항이 적용됩니다.-
이러한 머신 유형의 경우 스팟 VM을 사용하거나 MIG의 크기 조절 요청과 같이 동적 워크로드 스케줄러 (DWS)를 사용하는 기능을 사용해야 합니다. 이러한 옵션에 관한 자세한 안내는 다음을 검토하세요.
- Spot VM을 만들려면 가속기 최적화 VM 만들기를 참고하고 프로비저닝 모델을
SPOT
로 설정하세요. - 동적 워크로드 스케줄러를 사용하는 MIG에서 크기 조절 요청을 만들려면 GPU VM으로 MIG 만들기를 참고하세요.
- Spot VM을 만들려면 가속기 최적화 VM 만들기를 참고하고 프로비저닝 모델을
- 이러한 머신 유형에서는 하이퍼디스크 균형을 사용할 수 없습니다.
- 예약을 만들 수 없습니다.
-
이러한 머신 유형의 경우 스팟 VM을 사용하거나 MIG의 크기 조절 요청과 같이 동적 워크로드 스케줄러 (DWS)를 사용하는 기능을 사용해야 합니다. 이러한 옵션에 관한 자세한 안내는 다음을 검토하세요.
A2 머신 시리즈
A2 머신 시리즈는 A2 Standard 및 A2 Ultra 머신 유형에서 사용 가능합니다. 이러한 머신 유형은 12~96개의 vCPU와 최대 1,360GB 메모리를 포함합니다.
A2 머신 시리즈는 다음 기능도 제공합니다.
NVIDIA GPU가 연결됨: 각 A2 머신 유형에는 NVIDIA A100 GPU가 있습니다. A100 40GB 및 A100 80GB 옵션 모두에서 사용 가능합니다.
600Gbps의 GPU NVLink 대역폭에 최대 GPU를 제공하는 업계 최고의 NVLink 확장. 예를 들어 16개의 GPU가 있는 시스템의 총 NVLink 대역폭은 최대 9.6TBps입니다. 이러한 16개의 GPU는 통합 메모리 공간이 있는 단일 고성능 가속기로 사용되어 인공지능, 딥 러닝 및 머신러닝 워크로드에 사용할 수 있는 최대 10페타플롭의 컴퓨팅 성능과 최대 20페타플롭의 추론 컴퓨팅 성능을 제공합니다.
향상된 컴퓨팅 속도: 연결된 NVIDIA A100 GPU는 이전 세대 NVIDIA V100 GPU에 비해 컴퓨팅 속도가 최대 10배 향상됩니다.
A2 머신 시리즈를 사용하면 최대 100Gbps 네트워크 대역폭을 사용할 수 있습니다.
스토리지: 빠른 스크래치 디스크 또는 I/O 병목 현상을 방지하면서 GPU에 데이터를 공급하기 위해 A2 머신 유형은 다음과 같이 로컬 SSD를 지원합니다.
- A2 Standard 머신 유형의 경우 최대 3,000GiB까지 로컬 SSD를 추가할 수 있습니다.
- A2 Ultra 머신 유형의 경우 VM을 만들 때 로컬 SSD가 자동으로 연결됩니다.
또한 더 높은 스토리지 성능이 필요한 애플리케이션을 위해 A2 VM에 최대 257TiB의 영구 디스크 스토리지를 연결할 수도 있습니다.
압축 배치 정책 지원: 데이터 센터 내 VM의 실제 배치를 더 세부적으로 제어할 수 있습니다. 이렇게 하면 단일 가용성 영역 내에서 VM 배치의 지연 시간이 단축되고 대역폭이 증가합니다. 자세한 내용은 압축 배치 정책을 사용하여 지연 시간 감소를 참조하세요.
A2에 지원되는 디스크 유형
A2 VM은 다음 블록 스토리지 유형을 사용할 수 있습니다.
- Hyperdisk ML(
hyperdisk-ml
) - 균형 있는 영구 디스크(
pd-balanced
) - SSD(성능) 영구 디스크(
pd-ssd
) - 표준 영구 디스크(
pd-standard
) - 로컬 SSD: A2 Ultra 머신 유형을 사용하여 생성된 VM에 자동으로 연결됨
영구 디스크와 하이퍼디스크 볼륨을 혼합하여 VM에 사용할 수 있지만 다음과 같은 제한사항이 적용됩니다.
- 하이퍼디스크 및 영구 디스크 볼륨 수의 합계는 VM당 128개를 초과할 수 없습니다.
모든 디스크 유형에서 최대 총 디스크 용량(TiB)은 다음을 초과할 수 없습니다.
vCPU가 32개 미만인 머신 유형:
- 모든 하이퍼디스크 또는 모든 영구 디스크 257TiB
- 하이퍼디스크와 영구 디스크의 조합 257TiB
vCPU가 32개 이상인 머신 유형:
- 모든 하이퍼디스크 512TiB
- 하이퍼디스크 및 영구 디스크의 조합 512TiB
- 모든 영구 디스크 257TiB
용량 한도에 관한 자세한 내용은 VM당 하이퍼디스크 용량 한도 및 영구 디스크 최대 용량을 참조하세요.
A2 울트라 머신 유형
이러한 머신 유형에는 고정된 개수의 A100 80GB GPU가 포함됩니다. 로컬 SSD는 A2 Ultra 머신 유형을 사용하여 생성된 VM에 자동으로 연결됩니다.
머신 유형 | GPU 수 | GPU 메모리* (GB HBM3) |
vCPU 수† | VM 메모리(GB) | 연결된 로컬 SSD(GiB) | 최대 네트워크 대역폭(Gbps)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1,500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1,360 | 3,000 | 100 |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
A2 Ultra 제한사항
- A2 울트라 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A2 울트라 머신 유형을 사용할 수 있습니다.
- A2 울트라 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 A2 울트라 머신 유형을 사용할 수 있습니다.
- VM에서 A2 울트라 머신 유형을 사용하는 경우에는 머신 유형을 변경할 수 없습니다. 다른 A2 울트라 머신 유형이나 그 밖의 다른 머신 유형을 사용해야 하는 경우에는 새 VM을 만들어야 합니다.
- 다른 머신 유형을 A2 울트라 머신 유형으로 변경할 수 없습니다. A2 울트라 머신 유형을 사용하는 VM이 필요하면 새 VM을 만들어야 합니다.
- A2 울트라 머신 유형을 사용하는 Windows VM에서는 연결된 로컬 SSD를 빠르게 포맷할 수 없습니다. 이러한 로컬 SSD를 포맷하려면 diskpart 유틸리티를 사용하고
format fs=ntfs label=tmpfs
를 지정하여 전체 포맷을 수행해야 합니다.
A2 표준 머신 유형
이러한 머신 유형에는 고정된 개수의 A100 40GB GPU가 포함됩니다.
머신 유형 | GPU 수 | GPU 메모리* (GB HBM3) |
vCPU 수† | VM 메모리(GB) | 연결된 로컬 SSD(GiB) | 최대 네트워크 대역폭(Gbps)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | 예 | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | 예 | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | 예 | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | 예 | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1,360 | 예 | 100 |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
A2 Standard 제한사항
- A2 표준 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A2 표준 머신 유형을 사용할 수 있습니다.
- A2 표준 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 A2 표준 머신 유형을 사용할 수 있습니다.
- VM에서 A2 표준 머신 유형을 사용하는 경우 한 A2 표준 머신 유형에서 다른 A2 표준 머신 유형으로만 전환할 수 있습니다. 그 밖의 다른 머신 유형으로는 변경할 수 없습니다. 자세한 내용은 가속기 최적화 VM 수정을 참조하세요.
- <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 표준 머신 유형에서는 Windows 운영체제를 사용할 수 없습니다. Windows 운영체제를 사용하는 경우 다른 A2 표준 머신 유형을 선택합니다.</codea2-megagpu-16g<>
- A2 표준 머신 유형을 사용하는 Windows VM에서는 연결된 로컬 SSD를 빠르게 포맷할 수 없습니다. 이러한 로컬 SSD를 포맷하려면 diskpart 유틸리티를 사용하고
format fs=ntfs label=tmpfs
를 지정하여 전체 포맷을 수행해야 합니다. - A2 표준 머신 유형은 단독 테넌시를 지원하지 않습니다.
G2 머신 시리즈
G2 머신 시리즈는 4~96개의 vCPU와 최대 432GB의 메모리를 사용하는 표준 머신 유형에서 사용 가능합니다. 이 머신 시리즈는 추론 및 그래픽 워크로드에 최적화되어 있습니다.
G2 머신 시리즈는 다음 기능도 제공합니다.
NVIDIA GPU가 연결됨: 각 G2 머신 유형에는 NVIDIA L4 GPU가 있습니다.
추론 비율 개선: G2 머신 유형은 ML 추론 속도를 높이고 메모리 요구사항을 줄이는 데이터 유형인 FP8(8비트 부동 소수점) 데이터 유형에 대한 지원을 제공합니다.
차세대 그래픽 성능: NVIDIA L4 GPU는 3세대 RT 코어 및 NVIDIA DLSS 3(딥 러닝 슈퍼 샘플링) 기술을 사용하여 최대 3배 향상된 그래픽 성능을 제공합니다.
고성능 네트워크 대역폭: G2 머신 시리즈를 사용하면 최대 100Gbps의 네트워크 대역폭을 사용할 수 있습니다.
스토리지: G2 VM에 최대 3,000GiB의 로컬 SSD를 추가할 수 있습니다. 이를 빠른 스크래치 디스크로 사용하거나 I/O 병목 현상을 방지하면서 GPU에 데이터를 공급하는 데 사용할 수 있습니다.
더 많은 영구 스토리지가 필요한 애플리케이션을 위해 하이퍼디스크 및 영구 디스크 볼륨을 G2 VM에 연결할 수도 있습니다. 최대 스토리지 용량은 VM의 vCPU 수에 따라 다릅니다. 자세한 내용은 지원되는 디스크 유형을 참조하세요.
압축 배치 정책 지원: 데이터 센터 내 VM의 실제 배치를 더 세부적으로 제어할 수 있습니다. 이렇게 하면 단일 가용성 영역 내에서 VM 배치의 지연 시간이 단축되고 대역폭이 증가합니다. 자세한 내용은 압축 배치 정책을 사용하여 지연 시간 감소를 참조하세요.
G2에 지원되는 디스크 유형
G2 VM은 다음 블록 스토리지 유형을 사용할 수 있습니다.
- 균형 있는 영구 디스크(
pd-balanced
) - SSD(성능) 영구 디스크(
pd-ssd
) - Hyperdisk ML(
hyperdisk-ml
) - 하이퍼디스크 처리량(
hyperdisk-throughput
) - 로컬 SSD
영구 디스크와 하이퍼디스크 볼륨을 혼합하여 VM에 사용할 수 있지만 다음과 같은 제한사항이 적용됩니다.
- 하이퍼디스크 및 영구 디스크 볼륨 수의 합계는 VM당 128개를 초과할 수 없습니다.
모든 디스크 유형에서 최대 총 디스크 용량(TiB)은 다음을 초과할 수 없습니다.
vCPU가 32개 미만인 머신 유형:
- 모든 하이퍼디스크 또는 모든 영구 디스크 257TiB
- 하이퍼디스크와 영구 디스크의 조합 257TiB
vCPU가 32개 이상인 머신 유형:
- 모든 하이퍼디스크 512TiB
- 하이퍼디스크 및 영구 디스크의 조합 512TiB
- 모든 영구 디스크 257TiB
용량 한도에 관한 자세한 내용은 VM당 하이퍼디스크 용량 한도 및 영구 디스크 최대 용량을 참조하세요.
G2 머신 유형
각 G2 머신 유형에는 고정된 개수의 NVIDIA L4 GPU 및 vCPU가 연결되어 있습니다. 각 G2 머신 유형에는 기본 메모리와 커스텀 메모리 범위도 있습니다. 커스텀 메모리 범위는 각 머신 유형의 VM에 할당할 수 있는 메모리 양을 정의합니다. VM을 생성하는 동안 커스텀 메모리를 지정할 수 있습니다.
머신 유형 | GPU 수 | GPU 메모리*(GB GDDR6) | vCPU 수† | 기본 VM 메모리(GB) | 커스텀 VM 메모리 범위(GB) | 지원되는 최대 로컬 SSD(GiB) | 최대 네트워크 대역폭(Gbps)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | 16~32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | 32~54 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | 48~54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | 54~64 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | 96~108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | 96~128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | 192~216 | 1,500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | 384~432 | 3,000 | 100 |
*GPU 메모리는 데이터의 임시 저장에 사용할 수 있는 GPU 기기의 메모리입니다. VM의 메모리와는 별개이며 특히 그래픽 집약적인 워크로드의 더 높은 대역폭 수요를 처리하도록 설계되었습니다.
†vCPU는 사용 가능한 CPU 플랫폼 중 하나에서 단일 하드웨어 하이퍼 스레드로 구현됩니다.
‡최대 이그레스 대역폭은 지정된 수를 초과할 수 없습니다. 실제 이그레스 대역폭은 대상 IP 주소와 기타 요인에 따라 다릅니다.
네트워크 대역폭을 참조하세요.
G2 제한사항
- G2 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 G2 머신 유형을 사용할 수 있습니다.
- G2 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 G2 머신 유형을 사용할 수 있습니다.
- G2 표준 머신 유형을 사용하는 VM에서는 표준 영구 디스크(
pd-standard
)가 지원되지 않습니다. 지원되는 디스크 유형은 G2에 지원되는 디스크 유형을 참조하세요. - G2 머신 유형에서 멀티 인스턴스 GPU를 만들 수 없습니다.
- G2 VM 머신 유형을 변경해야 하는 경우 가속기 최적화 VM 수정을 참조하세요.
- Deep Learning VM Image를 G2 머신 유형을 사용하는 VM의 부팅 디스크로 사용할 수 없습니다.
- 현재 Container-Optimized OS의 기본 드라이버는 G2 머신 유형에서 실행되는 L4 GPU를 지원하지 않습니다. Container-Optimized OS는 선택한 드라이버 세트만 지원합니다.
G2 머신 유형에서 Container-Optimized OS를 사용하려면 다음 참고를 검토하세요.
- 권장되는 최소 NVIDIA 드라이버 버전
525.60.13
이상을 지원하는 Container-Optimized OS 버전을 사용합니다. 자세한 내용은 Container-Optimized OS 출시 노트를 참조하세요. - 드라이버 설치 시 L4 GPU에서 작동하는 최신 버전을 지정합니다.
예를 들면
sudo cos-extensions install gpu -- -version=525.60.13
입니다.
- 권장되는 최소 NVIDIA 드라이버 버전
- 다음 시나리오의 경우 G2 VM을 만들려면 Google Cloud CLI 또는 REST를 사용해야 합니다.
- 커스텀 메모리 값을 지정하려고 하는 경우
- 표시되는 CPU 코어 수를 맞춤설정하려고 합니다.