Compute Engine을 사용하여 가상 머신(VM) 또는 베어메탈 인스턴스를 만들 때는 인스턴스에 맞는 머신 시리즈와 머신 유형을 지정합니다. 각 머신 시리즈는 하나 이상의 CPU 플랫폼과 연관되어 있습니다. 머신 시리즈에 사용 가능한 CPU 플랫폼이 여러 개 있으면 컴퓨팅 인스턴스에 맞게 최소 CPU 플랫폼을 선택할 수 있습니다.
CPU 플랫폼은 여러 개의 물리적 프로세스를 제공합니다. 이러한 각 프로세서를 코어라고 합니다. Compute Engine에서 사용할 수 있는 프로세서에서 단일 CPU 코어는 Intel 프로세서에서 Intel 하이퍼스레딩 기술로 알려진 동시 멀티스레딩(SMT)을 통해 여러 하드웨어 스레드로 실행될 수 있습니다. Compute Engine에서 각 하드웨어 스레드를 가상 CPU(vCPU)라고 합니다. C4A, T2D, H3와 같은 일부 머신 시리즈는 SMT를 사용하지 않으며 각 vCPU가 코어를 나타냅니다. 여러 가상 코어를 점유하는 것으로 VM에 보고되는 경우 Compute Engine은 이러한 vCPU가 동일한 물리적 코어를 공유하지 않도록 합니다.
컴퓨팅 인스턴스의 머신 유형에 따라 vCPU 수가 지정되며, 해당 머신 시리즈의 코어당 기본 vCPU 비율에 따라 실제 CPU 코어 수를 추론할 수 있습니다.
- C4A, Tau T2D, Tau T2A, H3 머신 시리즈의 경우 VM에 항상 코어당 하나의 vCPU가 포함됩니다.
- 다른 머신 시리즈는 모두 컴퓨팅 인스턴스에 코어당 2개의 vCPU가 기본적으로 포함됩니다.
원하는 경우 코어당 스레드 수를 기본값이 아닌 값으로 설정할 수 있으며, 이 경우 일부 워크로드에 도움이 될 수 있습니다. 이렇게 해도 컴퓨팅 인스턴스의 머신 유형에는 더 이상 올바른 vCPU 수가 반영되지 않습니다. 대신 가격 책정 및 실제 CPU 코어 수는 코어당 기본 vCPU 2개의 비율과 동일하게 유지되며 vCPU 수는 머신 유형에 표시되는 값의 절반입니다.
Arm 프로세서
Arm 프로세서의 경우 Compute Engine은 코어당 하나의 스레드를 사용합니다. 각 vCPU는 SMT가 없는 물리적 코어에 매핑됩니다.
다음 표에서는 Compute Engine 인스턴스에 사용 가능한 Arm 프로세서를 설명합니다.
CPU 프로세서 및 SKU | 지원되는 머신 시리즈 및 유형 |
---|---|
Google Axion™ 프로세서 | C4A |
Ampere Altra Q64-30 | Tau T2A |
x86 프로세서
대부분의 x86 프로세서의 경우 각 vCPU가 단일 하드웨어 스레드로 구현됩니다. H3 머신 시리즈는 예외이며, 하나의 vCPU가 하나의 물리적 코어를 나타냅니다.
Intel 프로세서
Intel Xeon 프로세서의 경우 Intel 하이퍼 스레딩 기술은 각 코어에서 동시에 실행되는 여러 스레드를 지원합니다. 컴퓨팅 인스턴스의 머신 유형에 따라 vCPU의 수 및 메모리가 결정됩니다.
CPU 프로세서 | 프로세서 SKU | 지원되는 머신 시리즈 및 유형 | 기본 주파수(GHz) | All-Core Turbo 주파수(GHz) | Single-Core Max Turbo 주파수(GHz) |
---|---|---|---|---|---|
Intel Xeon 확장 가능 프로세서 (Emerald Rapids) 5세대 |
|||||
Intel® Xeon® Platinum 8581C 프로세서 |
2.3 | 3.1 | 4.0 | ||
Intel® Xeon® Platinum 8581C 프로세서 |
2.1 | 2.9 | 3.3 | ||
Intel Xeon 확장 가능 프로세서 (Sapphire Rapids) 4세대 |
Intel® Xeon® Platinum 8490H 프로세서 | 1.9 | 2.9 | 3.5 | |
Intel® Xeon® Platinum 8481C 프로세서 | 2.2 | 3.0 | 3.0 | ||
Intel® Xeon® Platinum 8481C 프로세서 | 2.0 | 3.8 | 2.9 | ||
Intel Xeon 확장 가능 프로세서(Ice Lake) 3세대 |
Intel® Xeon® Platinum 8373C 프로세서 |
2.6 | 3.4 | 3.5 | |
Intel Xeon 확장 가능 프로세서(Cascade Lake) 2세대 |
|||||
Intel® Xeon® Gold 6268CL 프로세서 | 2.8 | 3.4 | 3.9 | ||
Intel® Xeon® Gold 6253CL 프로세서 | 3.1 | 3.8 | 3.9 | ||
Intel® Xeon® Platinum 8280L 프로세서 | 2.5 | 3.4 | 4.0 | ||
Intel® Xeon® Platinum 8273CL 프로세서 | 2.2 | 2.9 | 3.7 | ||
Intel Xeon 확장 가능 프로세서(Skylake) 1세대 |
Intel® Xeon® 확장 가능 플래티넘 8173M 프로세서 | 2.0 | 2.7 | 3.5 | |
Intel Xeon E7(Broadwell E7) | Intel® Xeon® E7-8880V4 프로세서 | 2.2 | 2.6 | 3.3 | |
Intel Xeon E5 v4(Broadwell E5) | Intel® Xeon® E5-2696V4 프로세서 | 2.2 | 2.8 | 3.7 | |
Intel Xeon E5 v3(Haswell) | Intel® Xeon® E5-2696V3 프로세서 | 2.3 | 2.8 | 3.8 | |
Intel Xeon E5 v2(Ivy Bridge) | Intel® Xeon® E5-2696V2 프로세서 | 2.5 | 3.1 | 3.5 | |
Intel Xeon E5(Sandy Bridge) | Intel® Xeon® E5-2689 프로세서 | 2.6 | 3.2 | 3.6 |
*vCPU가 96개 이상 있는 N2 머신 유형은 Intel Ice Lake CPU가 필요합니다.
AMD 프로세서
AMD 프로세서는 SMT를 사용하여 최적화된 성능 및 확장성을 제공합니다. 거의 모든 경우에 Compute Engine은 코어당 2개의 스레드를 사용하며 각 vCPU가 하나의 스레드입니다. Tau T2D는 예외이고, Compute Engine에서 코어당 하나의 스레드가 사용되고 각 vCPU가 하나의 물리적 코어에 매핑됩니다. 컴퓨팅 인스턴스의 머신 유형에 따라 vCPU의 수 및 메모리가 결정됩니다.
CPU 프로세서 | 프로세서 SKU | 지원되는 머신 시리즈 | 기본 주파수(GHz) | 유효 주파수(GHz) | 최대 부스트 주파수(GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa 4세대 |
AMD EPYC™ 9B14 | 2.6 | 3.3 | 3.7 | |
AMD EPYC Milan 3세대 |
AMD EPYC™ 7B13 | 2.45 | 2.8 | 3.5 | |
AMD EPYC Rome 2세대 |
AMD EPYC™ 7B12 | 2.25 | 2.7 | 3.3 |
주파수 동작
이전 표에서는 Compute Engine에서 사용할 수 있는 CPU의 하드웨어 사양을 설명하지만 다음 사항에 주의해야 합니다.
주파수: PC의 주파수 또는 클럭 속도는 GHz(기가헤르츠) 단위로 CPU의 초당 실행 주기 수를 측정합니다. 일반적으로 주파수가 높을수록 성능이 뛰어납니다. 하지만 CPU 설계에 따라 명령 처리 방식이 다르고 신규 아키텍처의 경우 명령 처리 효율이 더 높기 때문에 클럭 속도가 높은 예전 CPU보다 클럭 속도가 낮은 새로운 CPU의 성능이 더 뛰어날 수 있습니다.
기본 주파수: 시스템이 유휴 상태 또는 가벼운 로드 상태일 때 CPU가 실행되는 주파수입니다. 기본 주파수로 작동되는 CPU는 전원 소비와 열 발생이 낮습니다.
컴퓨팅 인스턴스의 게스트 환경은 CPU가 실제로 실행되는 주파수와 상관없이 기본 주파수를 반영합니다.
All-Core Turbo 주파수: 소켓의 모든 코어가 동시에 유휴 상태가 아닐 때 각 CPU가 일반적으로 실행되는 빈도입니다. 워크로드에 따라 시스템 CPU에 대한 수요가 달라집니다. 부스트 기술은 이러한 차이를 해결하고 CPU 주파수를 증가시킴으로써 프로세스가 워크로드 수요에 적응할 수 있도록 지원합니다.
- 게스트 환경에는 기본 주파수만 공지되지만 대부분의 컴퓨팅 인스턴스는 올코어 터보 주파수를 수신합니다.
- Arm 프로세서의 주파수는 항상 올코어 터보 주파수이기 때문에 Ampere Altra Arm 프로세서는 보다 예측 가능한 성능을 제공할 수 있습니다.
- C4 VM은 AdvancedMachineFeature 필드를
ALL_CORE_MAX
로 설정하여 all-core-max 터보 주파수에서 실행할 수 있습니다. 이 필드가 설정되지 않으면 VM은 제한되지 않은 주파수인 기본 설정으로 실행됩니다.
최대 터보 주파수: 비디오 게임 또는 디자인 모델링 애플리케이션과 같이 까다로운 애플리케이션으로 스트레스를 받을 때 CPU가 타겟팅하는 주파수입니다. 오버클록 없이 CPU가 달성하는 최대 단일 코어 주파수입니다.
프로세서 전원 관리 기술: Intel 프로세서는 전원 소비를 최적화하기 위해 여러 기술을 지원합니다. 이러한 기술은 두 가지 카테고리 또는 상태로 나뉩니다.
- C-상태는 CPU가 감소된 또는 선택한 기능을 해제한 상태입니다.
- P-상태는 CPU의 전원 소비를 줄이기 위해 프로세서가 실행되는 주파수 및 전압을 조정할 수 있는 방법을 제공합니다.
모든 C4 머신 유형과 특정 C2(30, vCPU 60개), C2D(56, vCPU 112개), M2(208, vCPU 416개) 머신 유형은
MWAIT
명령을 통해 인스턴스에서 제공하는 C-상태 힌트를 지원합니다.Compute Engine 인스턴스는 고객이 P-상태를 제어할 수 있는 기능을 제공하지 않습니다.
CPU 기능
칩 제조업체는 계산, 그래픽, 가상화, 메모리 관리를 위한 첨단 기술을 자사가 생성하는 CPU에 추가합니다. Google Cloud는 Compute Engine에서 이러한 고급 기능 중 일부를 사용할 수 있도록 지원합니다.
고급 행렬 확장 프로그램(AMX)
Intel AMX는 인공지능(AI)과 머신러닝(ML) 워크로드를 가속화하도록 설계된 새로운 명령 집합 아키텍처(ISA) 확장 프로그램입니다. AMX는 AI와 ML에서 가장 일반적인 두 작업인 행렬 곱셈과 컨볼루션 연산을 수행하는 데 사용할 수 있는 새로운 안내를 제공합니다.
AMX는 C4 범용 VM 시리즈를 지원하는 Intel Xeon 5세대 프로세서(코드명 Emerald Rapids)와 A3 가속기 최적화 및 C3 범용 VM을 지원하는 Intel Xeon 4세대 프로세서(코드명 Sapphire Rapids)에서 지원됩니다. 모든 C4 및 C3 VM 머신 유형은 AMX 명령 집합을 지원합니다.
AMX는 가속기가 작업을 수행할 수 있는 타일이라는 2차원 레지스터를 소개합니다. AMX는 확장 가능한 아키텍처로 설계되었습니다. 구현되는 첫 번째 가속기는 타일 행렬 곱셈 단위(TMUL)라고 합니다. Sapphire Rapids 프로세서의 각 CPU 코어에는 독립적인 AMX TMUL 단위가 있습니다.
Intel AMX에 관한 자세한 기술적 내용은 5.16의 Intel AMX 지원을 참고하세요. Intel은 코드 샘플: Intel® Advanced Matrix Extensions(Intel® AMX) - Intrinsics Functions에서 AMX에 대한 튜토리얼을 제공합니다.
AMX 사용 요구사항
Intel AMX 명령에는 다음과 같은 특정 최소 소프트웨어 요구사항이 있습니다.
- 커스텀 이미지의 경우 AMX는 Linux 커널 버전 5.16 이상을 사용하여 지원됩니다.
- Compute Engine은 다음 공개 이미지에서 AMX를 지원합니다.
- CentOS Stream 8 이상
- Container-Optimized OS 109 LTS(이상)
- RHEL 8(최신 빌드) 이상
- Rocky Linux 8(최신 빌드) 이상
- Ubuntu 22.04 이상
- Windows Server 2022 이상
- Tensorflow 2.9.1 이상
- Intel® Optimization for PyTorch용 Intel 확장 프로그램
C4 및 C3 VM의 리전별 가용성은 사용 가능한 리전 및 영역을 참고하여 C4 또는 C3 머신 유형만 표시되도록 표를 필터링하세요.
베어메탈 인스턴스에 사용 가능한 CPU 기능
4세대 Intel Xeon 확장형 프로세서에서 실행되는 베어메탈 인스턴스는 서버의 모든 원시 컴퓨팅 리소스를 제공할 뿐만 아니라 여러 온보드 기능별 가속기와 오프로드를 사용할 수 있습니다.
- Intel-QAT: Intel QuickAssist Technology(Intel QAT)는 압축, 암호화, 복호화를 가속화합니다.
- Intel-DLB: Intel 동적 부하 분산기(Intel DLB)는 데이터 대기열 속도를 높이는 데 도움이 됩니다.
- Intel IAA: Intel In-Memory Analytics Accelerator(Intel IAA)는 쿼리 처리 성능을 개선합니다.
- Intel DSA: Intel Data Streaming Accelerator(Intel DSA)는 데이터를 더 빠르게 복사하고 이동하는 데 도움이 됩니다.
컨피덴셜 컴퓨팅
사용 중인 데이터를 보호하기 위해 컨피덴셜 컴퓨팅 기술을 지원하는 CPU 플랫폼을 사용하여 컨피덴셜 VM 인스턴스를 만들 수 있습니다.
컨피덴셜 VM 인스턴스 만들기 요구사항에 관한 자세한 내용은 지원되는 구성을 참고하세요.
다음 단계
- 머신 계열에 대해 자세히 알아보기
- 가상 머신 인스턴스에 대해 자세히 알아보기
- 이미지에 대해 자세히 알아보기
- 최소 CPU 플랫폼 지정 방법 알아보기
직접 사용해 보기
Google Cloud를 처음 사용하는 경우 계정을 만들어 실제 시나리오에서 Compute Engine의 성능을 평가할 수 있습니다. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
Compute Engine 무료로 사용해 보기