컴퓨팅에 사용되는 Arm VM

Google Cloud 는 C4A 및 A4X 머신 시리즈를 통해 Compute Engine에서 다양한 Arm 기반 서버를 제공합니다. Arm 아키텍처는 전력 효율에 최적화되어 있으므로 가성비가 우수합니다.

Arm 프로세서는 x86 서버와 비교되는 전원 효율로 인해 표준 서버에서 일반적으로 사용되고 있습니다. 휴대전화와 노트북은 Arm 프로세서로 실행되는 기기의 예시입니다. Arm CPU의 줄어든 명령 집합과 더 적은 명령으로 배터리 및 전원 소비가 줄어들고 성능 속도가 더 빠릅니다.

예를 들어 C4A는 Arm Neoverse V2 프로세서를 기반으로 하는 Google의 커스텀 Arm 프로세서인 Axion을 사용합니다. Neoverse V2는 Armv9 성능, 전력, 보안이 향상된 최초의 V 시리즈 CPU입니다. 고성능 컴퓨팅, 머신러닝, 범용 클라우드 컴퓨팅을 위해 설계되었습니다. 다음에는 C4A 범용 Arm 가상 머신(VM)을 사용하는 것이 좋습니다.

필요할 때 신속한 사용량 조정 기능이 필요한 컴퓨팅 집약적인 워크로드를 실행합니다.
Arm 호환 워크로드에서 가격-성능비를 최적화하기
최신 오픈소스 소프트웨어 스택을 기반으로 빌드하기
Arm CPU를 사용하는 모바일 또는 임베디드 시스템을 개발하고 테스트하기
워크로드가 Arm CPU에 적합한지 평가합니다.

Arm 기반 CPU와 함께 GPU를 사용하려면 NVIDIA GB200 NVL72 플랫폼에서 실행되는 A4X 머신 시리즈를 선택합니다. 이 머신 시리즈를 사용하여 만든 VM에는 NVIDIA GB200 Grace Blackwell Superchips가 연결되어 있습니다. 이 머신 시리즈는 머신러닝(ML) 및 고성능 컴퓨팅(HPC)과 같은 대규모 병렬 컴퓨팅 통합 기기 아키텍처(CUDA) 컴퓨팅 워크로드에 최적화되어 있습니다.

A4X 머신 시리즈

A4X는 Arm 기반 CPU 및 연결된 GPU가 모두 있는 최초의 Compute Engine VM입니다. A4X는 vCPU 최대 140개와 메모리 884GB가 있는 머신 유형을 제공합니다. A4X는 GPU당 메모리 180GB를 제공하는 NVIDIA GB200 GPU를 사용합니다. A4X에는 빠른 칩 간(NVLink C2C) 통신을 통해 B200 GPU 4개에 연결된 NVIDIA Grace Arm CPU가 있는 소켓 2개가 있습니다. A4X는 a4x-highgpu-4g 머신 유형에서 사용 가능합니다.

A4X 인스턴스의 스토리지 옵션

A4X는 Google Cloud Hyperdisk 연결 스토리지와 함께 사용될 수 있으며 로컬 SSD 12,000GiB와 함께 제공됩니다. Compute Engine은 인스턴스 생성 중에 자동으로 로컬 SSD 디스크를 A4X 인스턴스에 연결합니다.

OS 이미지

A4X 인스턴스는 공개 Arm 기반 OS 이미지를 지원합니다. 공개 Arm 기반 OS 이미지를 사용하여 커스텀 이미지를 만들 수도 있습니다.

C4A 머신 시리즈

C4A는 Google의 Axion Arm64 기반 CPU를 기반으로 빌드된 최초의 Arm 기반 VM입니다. C4A는 최대 72개의 vCPU와 576GB의 DDR5-5600 메모리를 사용하는 머신 유형을 제공합니다. C4A는 standard, highmem, highcpu 머신 유형으로 제공됩니다.

C4A는 네트워크 오프로드를 사용하고 gVNIC 네트워킹 인터페이스를 통해 최대 100Gbps의 VM당 Tier_1 네트워킹 성능을 지원하는 Titanium을 기반으로 합니다. C4A는 하이퍼디스크 균형 디스크 및 하이퍼디스크 익스트림 디스크가 있는 NVMe 디스크 인터페이스도 지원합니다.

동시 멀티스레딩

C4A 머신 시리즈의 경우 각 vCPU는 동시 멀티스레딩(SMT)이 없는 단일 코어로 지원됩니다. 따라서 C4A VM은 SMT가 사용 설정된 VM에 비해 vCPU당 더 높은 성능을 제공합니다. SMT는 특정 워크로드에서 이점을 제공하지만 프로세스가 다른 프로세스와 코어를 공유하는 대신 전체 코어에 액세스할 수 있기 때문에 컴퓨팅 집약적인 워크로드의 경우 단일 스레드 코어가 이상적입니다.

OS 이미지

C4A VM은 공개 Arm 기반 OS 이미지를 지원합니다. 또한 공개적으로 사용 가능한 Arm 기반 이미지를 사용하여 커스텀 이미지를 만들 수도 있습니다.

Tau T2A 머신 시리즈

Tau T2A Arm 머신 시리즈는 64코어 Ampere Altra Arm 프로세서에서 3.0GHz 전체 코어 주파수로 실행됩니다. Tau T2A를 사용하면 Arm에서 가장 잘 실행되거나 단독으로 실행되는 워크로드를 실행할 수 있습니다.

Tau T2A 머신 시리즈에는 vCPU당 4GB 메모리가 포함된 최대 48개의 물리적 코어를 포함하는 머신 유형이 사전 정의되어 있습니다. Tau T2A 머신 유형은 단일 NUMA 노드 내에서 실행됩니다.

Tau T2A 머신 유형은 스토리지의 경우 NVMe 인터페이스만 지원하고 네트워킹의 경우 Google 가상 NIC(gVNIC)만 지원합니다. Virtio-Net 및 SCSI 인터페이스는 지원되지 않습니다. 공개적으로 사용 가능한 모든 Arm OS 이미지는 NVMe 및 gVNIC 인터페이스를 사용하도록 구성되어 있습니다. gVNIC는 특히 Compute Engine을 위해 설계된 네트워크 인터페이스입니다. 더 나은 성능을 제공하고 더 높은 네트워크 대역폭 및 처리량을 지원합니다.

이 머신 시리즈에서 각 vCPU는 동시 멀티스레딩(SMT)이 없는 단일 코어로 지원됩니다.

워크로드 권장사항

C4A 머신 시리즈는 특히 가격 대비 성능이 중요한 다양한 수평 확장 및 컴퓨팅 집약적 워크로드에 적합합니다. 다음과 같은 워크로드를 배포할 때 C4A를 고려하세요.

ML 데이터 처리
ML 추론 및 모델 서빙
앱 제공, 웹 제공, 게임 제공
임베디드 시스템 개발
Arm에서 CI/CD 개발
동영상 및 이미지 인코딩, 트랜스코딩 및 처리
디지털 광고 거래소 및 서빙
캐시 서버
컴퓨팅 신약 개발
Android 개발
자율 또는 기존 자동차 소프트웨어 개발

다음 단계

A4X 머신 시리즈의 사양과 기능 검토
C4A 머신 시리즈의 사양 검토하기
Google Cloud에 사용 가능한 CPU 플랫폼에 대해 알아보기
Arm OS 이미지를 사용하여 Compute Engine 인스턴스 만들기 및 시작