CPU 플랫폼

Compute Engine을 사용하여 가상 머신(VM) 또는 베어메탈 인스턴스를 만들 때는 인스턴스에 맞는 머신 시리즈와 머신 유형을 지정합니다. 각 머신 시리즈는 하나 이상의 CPU 플랫폼과 연관되어 있습니다. 머신 시리즈에 사용 가능한 CPU 플랫폼이 여러 개 있으면 컴퓨팅 인스턴스에 맞게 최소 CPU 플랫폼을 선택할 수 있습니다.

CPU 플랫폼은 여러 개의 물리적 프로세스를 제공합니다. 이러한 각 프로세서를 코어라고 합니다. Compute Engine에서 사용할 수 있는 프로세서에서 단일 CPU 코어는 Intel 프로세서에서 Intel 하이퍼스레딩 기술로 알려진 동시 멀티스레딩(SMT)을 통해 여러 하드웨어 스레드로 실행될 수 있습니다. Compute Engine에서 각 하드웨어 스레드를 가상 CPU(vCPU)라고 합니다. C4A, T2D, H4D, H3와 같은 일부 머신 시리즈는 SMT를 사용하지 않으며 각 vCPU가 코어를 나타냅니다. 여러 가상 코어를 점유하는 것으로 인스턴스에 보고되는 경우 Compute Engine은 이러한 vCPU가 동일한 물리적 코어를 공유하지 않도록 합니다.

컴퓨팅 인스턴스의 머신 유형에 따라 vCPU 수가 지정되며, 해당 머신 시리즈의 코어당 기본 vCPU 비율에 따라 실제 CPU 코어 수를 추론할 수 있습니다.

C4A, T2D, T2A, H4D(프리뷰), H3, A4X 머신 시리즈의 경우 Compute Engine 인스턴스에는 항상 코어당 하나의 vCPU가 있습니다.
다른 머신 시리즈는 모두 컴퓨팅 인스턴스에 코어당 2개의 vCPU가 기본적으로 포함됩니다.

원하는 경우 코어당 스레드 수를 기본값이 아닌 값으로 설정할 수 있으며, 이 경우 일부 워크로드에 도움이 될 수 있습니다. 이렇게 해도 컴퓨팅 인스턴스의 머신 유형에는 더 이상 올바른 vCPU 수가 반영되지 않습니다. 대신 가격 책정 및 실제 CPU 코어 수는 코어당 기본 vCPU 2개의 비율과 동일하게 유지되며 vCPU 수는 머신 유형에 표시되는 값의 절반입니다.

Arm 프로세서

Arm 프로세서의 경우 Compute Engine은 코어당 하나의 스레드를 사용합니다. 각 vCPU는 SMT가 없는 물리적 코어에 매핑됩니다.

다음 표에서는 Compute Engine 인스턴스에 사용 가능한 Arm 프로세서를 설명합니다.

CPU 프로세서	프로세서 SKU	지원되는 머신 시리즈 및 유형
Arm Neoverse V2 코어가 탑재된 NVIDIA Grace 프로세서	Superchip	A4X
Google Axion 프로세서		C4A
Ampere Altra	Q64-30	Tau T2A

x86 프로세서

대부분의 x86 프로세서의 경우 각 vCPU가 단일 하드웨어 스레드로 구현됩니다. H3 머신 시리즈는 예외이며, 하나의 vCPU가 하나의 물리적 코어를 나타냅니다.

Intel 프로세서

Intel Xeon 프로세서의 경우 Intel 하이퍼 스레딩 기술은 각 코어에서 동시에 실행되는 여러 스레드를 지원합니다. 컴퓨팅 인스턴스의 머신 유형에 따라 vCPU의 수 및 메모리가 결정됩니다.

CPU 프로세서	프로세서 SKU	지원되는 머신 시리즈 및 유형	기본 주파수(GHz)	All-Core Turbo 주파수(GHz)	Single-Core Max Turbo 주파수(GHz)
Intel Xeon 확장 가능 프로세서 (Granite Rapids) 6세대
Intel Xeon 확장 가능 프로세서 (Granite Rapids) 6세대	Intel Xeon Platinum 6985P-C 프로세서	C4	2.8¹	3.9	4.2
Intel Xeon 스케일러블 프로세서 (Emerald Rapids) 5세대
	Intel Xeon Platinum 8581C 프로세서	A4 A3 Ultra M4	2.1	2.9	4.0
		C4	2.3	3.1	4.0
		N4	2.1	2.9	3.3
Intel Xeon 확장 가능 프로세서 (Sapphire Rapids) 4세대	Intel Xeon Platinum 8490H 프로세서	X4	1.9	2.9	3.5
	Intel Xeon Platinum 8481C 프로세서	C3 Z3 H3	2.2	3.0	3.0
		Z3 베어메탈	2.2	3.0	3.8
		A3 Mega A3 High A3 Edge	2.0	3.8	2.9
Intel Xeon 확장 가능 프로세서(Ice Lake) 3세대	Intel Xeon Platinum 8373C 프로세서	N2² M3	2.6	3.4	3.5
Intel Xeon 확장 가능 프로세서(Cascade Lake) 2세대
	Intel Xeon Gold 6268CL 프로세서	N2²	2.8	3.4	3.9
	Intel Xeon Gold 6253CL 프로세서	C2	3.1	3.8	3.9
	Intel Xeon Platinum 8280L 프로세서	M2	2.5	3.4	4.0
	Intel Xeon Platinum 8273CL 프로세서	A2 G2	2.2	2.9	3.7
Intel Xeon 확장 가능 프로세서(Skylake) 1세대	Intel Xeon 스케일러블 플래티넘 8173M 프로세서	E2 `m1-megamem` 메모리 최적화 머신 유형 N1	2.0	2.7	3.5
Intel Xeon E7(Broadwell E7)	Intel Xeon E7-8880V4 프로세서	`m1-ultramem` 메모리 최적화 머신 유형	2.2	2.6	3.3
Intel Xeon E5 v4(Broadwell E5)	Intel Xeon E5-2696V4 프로세서	E2 N1	2.2	2.8	3.7
Intel Xeon E5 v3(Haswell)	Intel Xeon E5-2696V3 프로세서	N1	2.3	2.8	3.8
Intel Xeon E5 v2(Ivy Bridge)	Intel Xeon E5-2696V2 프로세서	N1	2.5	3.1	3.5
Intel Xeon E5(Sandy Bridge)	Intel Xeon E5-2689 프로세서	N1	2.6	3.2	3.6

¹인텔 Granite Rapids CPU를 사용하는 C4 머신 유형의 기본 주파수는 2.8이지만 호환성을 위해 vPMU는 2.3을 표시합니다.

²vCPU가 96개 이상 있는 N2 머신 유형은 Intel Ice Lake CPU가 필요합니다.

AMD 프로세서

AMD 프로세서는 SMT를 사용하여 최적화된 성능 및 확장성을 제공합니다. 거의 모든 경우에 Compute Engine은 코어당 2개의 스레드를 사용하며 각 vCPU가 하나의 스레드입니다. H4D 및 Tau T2D는 예외이고, Compute Engine에서 코어당 하나의 스레드가 사용되고 각 vCPU가 하나의 물리적 코어에 매핑됩니다. 컴퓨팅 인스턴스의 머신 유형에 따라 인스턴스에 할당되는 vCPU 수와 메모리양이 결정됩니다.

CPU 프로세서	프로세서 SKU	지원되는 머신 시리즈	기본 주파수(GHz)	유효 주파수(GHz)	최대 부스트 주파수(GHz)
AMD EPYC Turin 5세대	AMD EPYC 9B45	C4D G4 H4D (프리뷰)	2.7	3.5	4.1
AMD EPYC Genoa 4세대	AMD EPYC 9B14	C3D	2.6	3.3	3.7
AMD EPYC Milan 3세대	AMD EPYC 7B13	E2 Tau T2D N2D C2D	2.45	2.8	3.5
AMD EPYC Rome 2세대	AMD EPYC 7B12	E2 N2D	2.25	2.7	3.3

주파수 동작

이전 표에서는 Compute Engine에서 사용할 수 있는 CPU의 하드웨어 사양을 설명하지만 다음 사항에 주의해야 합니다.

주파수: PC의 주파수 또는 클럭 속도는 GHz(기가헤르츠) 단위로 CPU의 초당 실행 주기 수를 측정합니다. 일반적으로 주파수가 높을수록 성능이 뛰어납니다. 하지만 CPU 설계에 따라 명령 처리 방식이 다르고 신규 아키텍처의 경우 명령 처리 효율이 더 높기 때문에 클럭 속도가 높은 예전 CPU보다 클럭 속도가 낮은 새로운 CPU의 성능이 더 뛰어날 수 있습니다.
기본 주파수: 시스템이 유휴 상태 또는 가벼운 로드 상태일 때 CPU가 실행되는 주파수입니다. 기본 주파수로 작동되는 CPU는 전원 소비와 열 발생이 낮습니다.

컴퓨팅 인스턴스의 게스트 환경은 CPU가 실제로 실행되는 주파수와 상관없이 기본 주파수를 반영합니다.
All-Core Turbo 주파수: 소켓의 모든 코어가 동시에 유휴 상태가 아닐 때 각 CPU가 일반적으로 실행되는 빈도입니다. 워크로드에 따라 시스템 CPU에 대한 수요가 달라집니다. 부스트 기술은 이러한 차이를 해결하고 CPU 주파수를 증가시킴으로써 프로세스가 워크로드 수요에 적응할 수 있도록 지원합니다.
- 게스트 환경에는 기본 주파수만 공지되지만 대부분의 컴퓨팅 인스턴스는 올코어 터보 주파수를 수신합니다.
- Arm 프로세서의 주파수는 항상 올코어 터보 주파수이기 때문에 Ampere Altra Arm 프로세서는 보다 예측 가능한 성능을 제공할 수 있습니다.
- C4 인스턴스는 AdvancedMachineFeature 필드를 ALL_CORE_MAX로 설정하여 all-core-max 터보 주파수에서 실행할 수 있습니다. 이 필드가 설정되지 않으면 인스턴스는 제한되지 않은 주파수인 기본 설정으로 실행됩니다.
  
  C4D 또는 C4A 컴퓨팅 인스턴스에서는 ALL_CORE_MAX 설정을 사용할 수 없습니다.
최대 터보 주파수: 비디오 게임 또는 디자인 모델링 애플리케이션과 같이 까다로운 애플리케이션으로 스트레스를 받을 때 CPU가 타겟팅하는 주파수입니다. 오버클록 없이 CPU가 달성하는 최대 단일 코어 주파수입니다.
프로세서 전원 관리 기술: Intel 프로세서는 전원 소비를 최적화하기 위해 여러 기술을 지원합니다. 이러한 기술은 두 가지 카테고리 또는 상태로 나뉩니다.
- C-상태는 CPU가 감소된 또는 선택한 기능을 해제한 상태입니다.
- P-상태는 CPU의 전원 소비를 줄이기 위해 프로세서가 실행되는 주파수 및 전압을 조정할 수 있는 방법을 제공합니다.
모든 C4 머신 유형과 특정 C2(30, vCPU 60개), C2D(56, vCPU 112개), M2(208, vCPU 416개) 머신 유형은 MWAIT 명령을 통해 인스턴스에서 제공하는 C-상태 힌트를 지원합니다.

Compute Engine 인스턴스는 고객이 P-상태를 제어할 수 있는 기능을 제공하지 않습니다.

CPU 기능

칩 제조업체는 계산, 그래픽, 가상화, 메모리 관리를 위한 첨단 기술을 자사가 생성하는 CPU에 추가합니다. Google Cloud는 Compute Engine에서 이러한 고급 기능 중 일부를 사용할 수 있도록 지원합니다.

Advanced Vector Extensions

Advanced Vector Extensions(AVX)는 Intel 및 Advanced Micro Devices(AMD)의 마이크로프로세서용 x86 명령 집합 아키텍처에 대한 단일 명령, 다중 데이터(SIMD) 확장 프로그램입니다. AVX는 새로운 명령과 새로운 코딩 스키마를 제공합니다.

자세한 내용은 Advanced Vector Extensions를 참조하세요.

AVX는 Compute Engine에서 사용하는 모든 x86 프로세서에서 사용할 수 있습니다.

Advanced Vector Extensions(AVX2)

AVX2(Haswell의 새로운 명령어라고도 함)는 AVX에 다음과 같은 추가사항을 도입합니다.

대부분의 벡터 정수 SSE 및 AVX 명령을 256비트로 확장
Gather 지원을 추가하여 벡터 요소를 연속되지 않은 메모리 위치에서 로드 가능
DWORD 및 QWORD 단위로 모든 항목 간 순열
벡터 이동

AVX2는 다음 CPU 플랫폼에서 사용할 수 있습니다.

Intel Xeon E5 v3(Haswell) 및 이후 프로세서
모든 AMD 프로세서

Advanced Vector Extensions(AVX512)

AVX-512는 EVEX 프리픽스 인코딩을 사용하여 AVX를 512비트 지원으로 확장합니다. AVX-512는 벡터 기반 처리가 많은 까다로운 워크로드에 기본 제공되는 가속을 제공합니다. AVX-512 가속기의 대용량 레지스터는 8개의 64비트 정수와 16개의 32비트 정수 외에도 32개의 배정밀도 부동 소수점 수와 64개의 단정밀도 부동 소수점 수를 지원합니다.

AVX-512에 관한 자세한 내용은 Intel AVX-512란 무엇인가요?를 참조하세요.

AVX-512는 다음 CPU 플랫폼에서 사용할 수 있습니다.

Intel Xeon 스케일러블 프로세서(Skylake) 1세대 및 이후 프로세서
AMD EPYC Genoa 4세대 및 이후 프로세서

Advanced Matrix Extensions

Intel Advanced Matrix Extensions(AMX)는 인공지능(AI)과 머신러닝(ML) 워크로드를 가속화하도록 설계된 새로운 명령 집합 아키텍처(ISA) 확장 프로그램입니다. AMX는 AI와 ML에서 가장 일반적인 두 작업인 행렬 곱셈과 컨볼루션 연산을 수행하는 데 사용할 수 있는 새로운 안내를 제공합니다.

AMX는 가속기가 작업을 수행할 수 있는 타일이라는 2차원 레지스터를 소개합니다. AMX는 확장 가능한 아키텍처로 설계되었습니다. 구현되는 첫 번째 가속기는 타일 행렬 곱셈 단위(TMUL)라고 합니다. Sapphire Rapids 프로세서의 각 CPU 코어에는 독립적인 AMX TMUL 단위가 있습니다.

Intel AMX에 관한 기술적 세부정보는 5.16의 Intel AMX 지원을 참조하세요. Intel은 코드 샘플: Intel Advanced Matrix Extensions(Intel AMX) - Intrinsics Functions에서 AMX에 대한 튜토리얼을 제공합니다.

AMX는 Intel Xeon 4세대(Sapphire Rapids) 및 이후 프로세서에서 사용할 수 있습니다. AMD 또는 Arm 프로세서에서는 AMX를 사용할 수 없습니다.

AMX 사용 요구사항

Intel AMX 명령에는 다음과 같은 특정 최소 소프트웨어 요구사항이 있습니다.

커스텀 이미지의 경우 AMX는 Linux 커널 버전 5.16 이상을 사용하여 지원됩니다.
Compute Engine은 다음 공개 이미지에서 AMX를 지원합니다.
- CentOS Stream 9
- Container-Optimized OS 109 LTS(이상)
- RHEL 8(최신 빌드) 이상
- Rocky Linux 8(최신 빌드) 이상
- Ubuntu 22.04 이상
- Windows Server 2022 이상
Tensorflow 2.9.1 이상
Intel Optimization for PyTorch용 Intel 확장 프로그램

베어메탈 인스턴스에 사용 가능한 CPU 기능

4세대 이상의 Intel Xeon 스케일러블 프로세서에서 실행되는 베어메탈 인스턴스는 서버의 모든 원시 컴퓨팅 리소스를 제공할 뿐만 아니라 여러 온보드 기능별 가속기와 오프로드를 사용할 수 있습니다.

Intel-QAT: Intel QuickAssist Technology(Intel QAT)는 압축, 암호화, 복호화를 가속화합니다.
Intel-DLB: Intel 동적 부하 분산기(Intel DLB)는 데이터 대기열 속도를 높이는 데 도움이 됩니다.
Intel IAA: Intel In-Memory Analytics Accelerator(Intel IAA)는 쿼리 처리 성능을 개선합니다.
Intel DSA: Intel Data Streaming Accelerator(Intel DSA)는 데이터를 더 빠르게 복사하고 이동하는 데 도움이 됩니다.

컨피덴셜 컴퓨팅

사용 중인 데이터를 보호하기 위해 컨피덴셜 컴퓨팅 기술을 지원하는 CPU 플랫폼을 사용하여 컨피덴셜 VM 인스턴스를 만들 수 있습니다.

컨피덴셜 VM 인스턴스 만들기 요구사항에 관한 자세한 내용은 지원되는 구성을 참조하세요.

다음 단계

머신 계열에 대해 자세히 알아보기
Compute Engine 인스턴스에 대해 자세히 알아보기
이미지에 대해 자세히 알아보기
최소 CPU 플랫폼 지정 방법 알아보기

직접 사용해 보기

Google Cloud를 처음 사용하는 경우 계정을 만들어 실제 시나리오에서 Compute Engine의 성능을 평가할 수 있습니다. 또한 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

Compute Engine 무료로 사용해 보기