Google Cloud 는 C4A 및 A4X 머신 시리즈를 통해 Compute Engine에서 다양한 Arm 기반 서버를 제공합니다. Arm 아키텍처는 전력 효율에 최적화되어 있으므로 가성비가 우수합니다.
Arm 프로세서는 x86 서버와 비교되는 전원 효율로 인해 표준 서버에서 일반적으로 사용되고 있습니다. 휴대전화와 노트북은 Arm 프로세서로 실행되는 기기의 예시입니다. Arm CPU의 줄어든 명령 집합과 더 적은 명령으로 배터리 및 전원 소비가 줄어들고 성능 속도가 더 빠릅니다.
예를 들어 C4A는 Arm Neoverse V2 프로세서를 기반으로 하는 Google의 커스텀 Arm 프로세서인 Axion을 사용합니다. Neoverse V2는 Armv9 성능, 전력, 보안이 향상된 최초의 V 시리즈 CPU입니다. 고성능 컴퓨팅, 머신러닝, 범용 클라우드 컴퓨팅을 위해 설계되었습니다. 다음에는 C4A 범용 Arm 가상 머신(VM)을 사용하는 것이 좋습니다.
필요할 때 신속한 사용량 조정 기능이 필요한 컴퓨팅 집약적인 워크로드를 실행합니다.
Arm 호환 워크로드에서 가격-성능비를 최적화하기
최신 오픈소스 소프트웨어 스택을 기반으로 빌드하기
Arm CPU를 사용하는 모바일 또는 임베디드 시스템을 개발하고 테스트하기
워크로드가 Arm CPU에 적합한지 평가합니다.
Arm 기반 CPU와 함께 GPU를 사용하려면 NVIDIA GB200 NVL72 플랫폼에서 실행되는 A4X 머신 시리즈를 선택합니다. 이 머신 시리즈를 사용하여 만든 VM에는 NVIDIA GB200 Grace Blackwell Superchips가 연결되어 있습니다. 이 머신 시리즈는 머신러닝(ML) 및 고성능 컴퓨팅(HPC)과 같은 대규모 병렬 컴퓨팅 통합 기기 아키텍처(CUDA) 컴퓨팅 워크로드에 최적화되어 있습니다.
A4X 머신 시리즈
A4X는 Arm 기반 CPU 및 연결된 GPU가 모두 있는 최초의 Compute Engine VM입니다. A4X는 vCPU 최대 140개와 메모리 884GB가 있는 머신 유형을 제공합니다. A4X는 GPU당 메모리 180GB를 제공하는 NVIDIA GB200 GPU를 사용합니다. A4X에는 빠른 칩 간(NVLink C2C) 통신을 통해 B200 GPU 4개에 연결된 NVIDIA Grace Arm CPU가 있는 소켓 2개가 있습니다.
A4X는 a4x-highgpu-4g 머신 유형에서 사용 가능합니다.
A4X 인스턴스의 스토리지 옵션
A4X는 Google Cloud Hyperdisk 연결 스토리지와 함께 사용될 수 있으며 로컬 SSD 12,000GiB와 함께 제공됩니다. Compute Engine은 인스턴스 생성 중에 자동으로 로컬 SSD 디스크를 A4X 인스턴스에 연결합니다.
OS 이미지
A4X 인스턴스는 공개 Arm 기반 OS 이미지를 지원합니다.
공개 Arm 기반 OS 이미지를 사용하여 커스텀 이미지를 만들 수도 있습니다.
C4A 머신 시리즈
C4A는 Google의 Axion Arm64 기반 CPU를 기반으로 빌드된 최초의 Arm 기반 VM입니다. C4A는 최대 72개의 vCPU와 576GB의 DDR5-5600 메모리를 사용하는 머신 유형을 제공합니다. C4A는 standard, highmem, highcpu 머신 유형으로 제공됩니다.
C4A는 네트워크 오프로드를 사용하고 gVNIC 네트워킹 인터페이스를 통해 최대 100Gbps의 VM당 Tier_1 네트워킹 성능을 지원하는 Titanium을 기반으로 합니다.
C4A는 하이퍼디스크 균형 디스크 및 하이퍼디스크 익스트림 디스크가 있는 NVMe 디스크 인터페이스도 지원합니다.
동시 멀티스레딩
C4A 머신 시리즈의 경우 각 vCPU는 동시 멀티스레딩(SMT)이 없는 단일 코어로 지원됩니다.
따라서 C4A VM은 SMT가 사용 설정된 VM에 비해 vCPU당 더 높은 성능을 제공합니다. SMT는 특정 워크로드에서 이점을 제공하지만 프로세스가 다른 프로세스와 코어를 공유하는 대신 전체 코어에 액세스할 수 있기 때문에 컴퓨팅 집약적인 워크로드의 경우 단일 스레드 코어가 이상적입니다.
OS 이미지
C4A VM은 공개 Arm 기반 OS 이미지를 지원합니다.
또한 공개적으로 사용 가능한 Arm 기반 이미지를 사용하여 커스텀 이미지를 만들 수도 있습니다.
Tau T2A 머신 시리즈
Tau T2A Arm 머신 시리즈는 64코어 Ampere Altra Arm 프로세서에서 3.0GHz 전체 코어 주파수로 실행됩니다. Tau T2A를 사용하면 Arm에서 가장 잘 실행되거나 단독으로 실행되는 워크로드를 실행할 수 있습니다.
Tau T2A 머신 시리즈에는 vCPU당 4GB 메모리가 포함된 최대 48개의 물리적 코어를 포함하는 머신 유형이 사전 정의되어 있습니다. Tau T2A 머신 유형은 단일 NUMA 노드 내에서 실행됩니다.
Tau T2A 머신 유형은 스토리지의 경우 NVMe 인터페이스만 지원하고 네트워킹의 경우 Google 가상 NIC(gVNIC)만 지원합니다. Virtio-Net 및 SCSI 인터페이스는 지원되지 않습니다. 공개적으로 사용 가능한 모든 Arm OS 이미지는 NVMe 및 gVNIC 인터페이스를 사용하도록 구성되어 있습니다. gVNIC는 특히 Compute Engine을 위해 설계된 네트워크 인터페이스입니다. 더 나은 성능을 제공하고 더 높은 네트워크 대역폭 및 처리량을 지원합니다.
이 머신 시리즈에서 각 vCPU는 동시 멀티스레딩(SMT)이 없는 단일 코어로 지원됩니다.
워크로드 권장사항
C4A 머신 시리즈는 특히 가격 대비 성능이 중요한 다양한 수평 확장 및 컴퓨팅 집약적 워크로드에 적합합니다.
다음과 같은 워크로드를 배포할 때 C4A를 고려하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-03(UTC)"],[[["\u003cp\u003eGoogle Cloud offers Arm-powered servers in Compute Engine, including the C4A machine series built on Google's custom Axion Arm64-based CPU, which are optimized for power efficiency and deliver better price for performance.\u003c/p\u003e\n"],["\u003cp\u003eThe C4A machine series provides up to 72 vCPUs, 576 GB of DDR5-5600 memory, supports up to 100 Gbps per VM networking performance through Titanium, and is ideal for compute-intensive workloads and Arm-compatible applications.\u003c/p\u003e\n"],["\u003cp\u003eThe Tau T2A machine series, running on the Ampere Altra Arm processor, offers up to 48 physical cores, 4GB of memory per vCPU, and supports only NVMe and gVNIC interfaces, making it suitable for workloads that specifically benefit from the Arm architecture.\u003c/p\u003e\n"],["\u003cp\u003eC4A and Tau T2A machine series both use a single core for each vCPU without simultaneous multithreading (SMT), which provides higher performance per vCPU and is ideal for compute-intensive tasks.\u003c/p\u003e\n"],["\u003cp\u003eArm servers are power efficient and are a great solution for a vast range of workloads, such as ML, image encoding, web and app serving, and more, providing a great alternative to x86 servers.\u003c/p\u003e\n"]]],[],null,["*** ** * ** ***\n\nGoogle Cloud offers a range of Arm powered servers in Compute Engine through\nthe C4A and A4X machine series. Arm architecture is optimized for power efficiency, and as a result can yield better price for performance.\n\nArm processors are common in standard servers due to their power efficiency as\ncompared to x86 servers. Mobile phones and laptops are examples of devices that\nrun on an Arm processor. With an Arm CPU's reduced instruction set, fewer\ninstructions equals greater performance speed with lower battery and power\nconsumption.\n\nFor example, C4A uses Google's custom Arm processor, Axion, which is based on\nthe Arm Neoverse V2 processor. The Neoverse V2 is the first V-series CPU to\nhave Armv9 performance, power, and security enhancements. It is designed for\nhigh performance computing, machine learning, and general-purpose cloud\ncomputing. Consider using C4A general-purpose Arm virtual machines (VMs) for\nany of the following purposes:\n\n- Run compute-intensive workloads that require the ability to scale usage quickly when needed.\n- Optimize for price-performance on Arm-compatible workloads.\n- Build on modern, open source software stacks.\n- Develop and test mobile or embedded systems which use an Arm CPU.\n- Evaluate whether your workload is suitable for an Arm CPU.\n\nTo use GPUs with an Arm-based CPU, choose the A4X machine series, which runs on\nthe NVIDIA GB200 NVL72 platform. VMs created using this machine series have\nattached NVIDIA GB200 Grace Blackwell Superchips. This machine series is\noptimized for massively parallelized Compute Unified Device Architecture (CUDA)\ncompute workloads, such as machine learning (ML) and high performance computing\n(HPC).\n\nA4X machine series\n\n[A4X](/compute/docs/accelerator-optimized-machines#a4x_series) is the first Compute Engine VM with both Arm-based CPUs and attached GPUs. A4X\noffers machine types that have up to 140 vCPUs,\nand 884 GB of memory. A4X uses NVIDIA GB200 GPUs, which offer\n180 GB memory per GPU. A4X has two sockets with NVIDIA Grace Arm CPUs\nconnected to four B200 GPUs with fast chip-to-chip (NVLink C2C) communication.\nA4X is available in the `a4x-highgpu-4g` machine type.\n\nStorage options for A4X instances\n\nA4X can be used with Google Cloud Hyperdisk attached storage and comes with\n12,000 GiB of [Local SSD](/compute/docs/disks/local-ssd). Compute Engine\nautomatically attaches the Local SSD disks to your A4X instances during instance\ncreation.\n\nOS images\n\nA4X instances support public Arm-based [OS images](/compute/docs/images/os-details).\nYou can also [create custom images](/compute/docs/images/create-custom)\nusing a public Arm-based OS image.\n\nC4A machine series\n\n[C4A](/compute/docs/general-purpose-machines#c4a_series) is the first\nArm-based VM built on Google's Axion\nArm64-based CPU. C4A offers machine types with up to 72 vCPUs and 576 GB of\nDDR5-5600 memory. C4A is available in `standard`, `highmem`, and `highcpu`\nmachine types.\n\nC4A is built on [Titanium](/titanium) which uses network offloads and\nenables per VM Tier_1 networking performance of up to 100 Gbps with the\n[gVNIC networking interface](/compute/docs/networking/using-gvnic).\nC4A also supports the NVMe disk interface with Hyperdisk Balanced and Hyperdisk Extreme disks.\n\nSimultaneous multithreading\n\nFor the C4A machine series, each vCPU is backed by a single core with no\n[simultaneous multithreading (SMT)](/compute/docs/instances/set-threads-per-core).\nThus, C4A VMs deliver greater performance per vCPU compared to a VM with SMT\nenabled. While SMT provides benefits to certain workloads, single-threaded cores\nare ideal for compute-intensive workloads because the processes can access the\nentire core instead of sharing it with other processes.\n\nOS images\n\nC4A VMs support public Arm-based [OS images](/compute/docs/images/os-details).\nYou can also [create custom images](/compute/docs/images/create-custom)\nusing a publicly-available Arm-based image.\n\nTau T2A machine series\n\nThe [Tau T2A Arm](/compute/docs/general-purpose-machines#t2a_machines)\nmachine series runs on the 64 core Ampere Altra Arm processor at 3.0 GHz\nall-core frequency. Tau T2A makes it possible to run workloads that run best,\nor exclusively, on Arm.\n\nThe [Tau T2A machine series](/compute/docs/general-purpose-machines#t2a_machines)\nhas predefined machine types of up to 48 physical cores with 4 GB of memory per\nvCPU. Tau T2A machine types run within a single\n[NUMA](https://www.kernel.org/doc/html/v4.18/vm/numa.html)\nnode.\n\nTau T2A machine types support only the NVMe interface for storage, and\n[Google virtual NIC (gVNIC)](/compute/docs/networking/using-gvnic) for\nnetworking. Virtio-Net and SCSI interfaces are not supported. All\npublicly-available Arm [OS images](/compute/docs/images/os-details)\nare configured to use the NVMe and gVNIC interfaces.\ngVNIC is a network interface that is designed specifically for\nCompute Engine. It provides better performance and supports higher\nnetwork bandwidths and throughput.\n\nFor this machine series, each vCPU is backed by a single core with no\nsimultaneous multithreading (SMT).\n\nWorkload recommendations\n\nThe C4A machine series is an excellent choice for a wide range of scale-out and\ncompute-intensive workloads, especially when price performance is a key concern.\nConsider C4A when you are deploying workloads such as the following:\n\n- ML data processing\n- ML inferencing and model serving\n- App serving, web serving, and game serving\n- Embedded systems development\n- Development on CI/CD on Arm\n- Video and image encoding, transcoding, and processing\n- Digital advertising exchanges and serving\n- Cache servers\n- Computational drug discovery\n- Android development\n- Autonomous or conventional automotive software development\n\nWhat's next\n\n- Review the specifications and features of the [A4X machine series](/compute/docs/accelerator-optimized-machines#a4x_series).\n- Review the specifications for the [C4A machine series](/compute/docs/general-purpose-machines#c4a_series).\n- Learn about available [CPU platforms](/compute/docs/cpu-platforms) for Google Cloud.\n- [Create and start a Compute Engine instance](/compute/docs/instances/create-vm-from-public-image) using an Arm OS image."]]