Halaman ini diterjemahkan oleh Cloud Translation API.

Platform CPU

Saat membuat virtual machine (VM) atau instance bare metal menggunakan Compute Engine, Anda menentukan seri mesin dan jenis mesin untuk instance. Setiap seri mesin dikaitkan dengan satu atau beberapa platform CPU. Jika ada beberapa platform CPU yang tersedia untuk seri mesin, Anda dapat memilih platform CPU minimum untuk instance komputasi.

Platform CPU menawarkan beberapa prosesor fisik, dan setiap prosesor ini disebut sebagai inti. Untuk prosesor yang tersedia di Compute Engine, satu inti CPU dapat berjalan sebagai beberapa thread hardware melalui Simultaneous multithreading (SMT), yang dikenal pada prosesor Intel sebagai Intel Hyper-Threading Technology. Di Compute Engine, setiap thread hardware disebut CPU virtual (vCPU). Beberapa seri mesin, seperti C4A, T2D, H4D, dan H3, tidak menggunakan SMT, dan setiap vCPU mewakili inti. Saat vCPU dilaporkan ke instance karena menggunakan inti virtual yang berbeda, Compute Engine memverifikasi bahwa vCPU tersebut tidak pernah berbagi inti fisik yang sama.

Jenis mesin instance komputasi Anda menentukan jumlah vCPU-nya, dan Anda dapat menyimpulkan jumlah inti CPU fisiknya menggunakan rasio vCPU per inti default untuk seri mesin tersebut:

Untuk seri mesin C4A, T2D, T2A, H4D (Pratinjau), H3, dan A4X, instance Compute Engine selalu memiliki satu vCPU per inti.
Untuk semua seri mesin lainnya, instance komputasi memiliki dua vCPU per inti secara default.

Anda juga dapat menyetel jumlah thread per inti , ke nilai non-default, yang mungkin bermanfaat bagi beberapa beban kerja. Yang penting, saat Anda melakukannya, jenis mesin instance komputasi Anda tidak lagi mencerminkan jumlah vCPU yang benar. Sebaliknya, harga dan jumlah inti CPU fisik tetap sama untuk dua vCPU default per rasio inti, dan jumlah vCPU adalah setengah dari nilai yang ditunjukkan oleh jenis mesin.

Prosesor Arm

Untuk prosesor Arm, Compute Engine menggunakan satu thread per core. Setiap vCPU dipetakan ke inti fisik tanpa SMT.

Tabel berikut menjelaskan prosesor Arm yang tersedia untuk instance Compute Engine.

Prosesor CPU	SKU Prosesor	Seri dan jenis mesin yang didukung
Prosesor NVIDIA Grace dengan core Arm Neoverse V2	Superchip	A4X
Prosesor Axion Google		C4A
Ampere Altra	Q64-30	Tau T2A

Prosesor x86

Untuk sebagian besar prosesor x86, setiap vCPU diimplementasikan sebagai satu thread hardware. Seri mesin H3 adalah pengecualian, dengan satu vCPU yang mewakili satu inti fisik.

Prosesor Intel

Pada prosesor Intel Xeon, Intel Hyper-Threading Technology mendukung beberapa thread yang berjalan secara serentak pada setiap inti. Jenis mesin instance komputasi Anda menentukan jumlah vCPU dan memori.

Prosesor CPU	SKU Prosesor	Seri dan jenis mesin yang didukung	Frekuensi dasar (GHz)	Frekuensi turbo semua inti (GHz)	Frekuensi turbo maks inti tunggal (Ghz)
Prosesor Intel Xeon Scalable (Granite Rapids) generasi ke-6
Prosesor Intel Xeon Scalable (Granite Rapids) generasi ke-6	Prosesor Intel Xeon Platinum 6985P-C	C4	2.8¹	3.9	4.2
Prosesor Intel Xeon Scalable (Emerald Rapids) generasi ke-5
	Prosesor Intel Xeon Platinum 8581C	A4 A3 Ultra M4	2.1	2.9	4.0
		C4	2.3	3.1	4.0
		N4	2.1	2.9	3.3
Prosesor Intel Xeon Scalable (Sapphire Rapids) generasi ke-4	Prosesor Intel Xeon Platinum 8490H	X4	1.9	2.9	3,5
	Prosesor Intel Xeon Platinum 8481C	C3 Z3 H3	2.2	3.0	3.0
		Bare metal Z3	2.2	3.0	3.8
		A3 Mega A3 High A3 Edge	2.0	3.8	2.9
Prosesor Intel Xeon Scalable (Ice Lake) Generasi ke-3	Prosesor Intel Xeon Platinum 8373C	N2² M3	2.6	3.4	3.5
Prosesor Intel Xeon Skalabel (Cascade Lake) Generasi ke-2
	Prosesor Intel Xeon Gold 6268CL	N2²	2.8	3.4	3.9
	Prosesor Intel Xeon Gold 6253CL	C2	3.1	3.8	3.9
	Prosesor Intel Xeon Platinum 8280L	M2	2.5	3.4	4.0
	Prosesor Intel Xeon Platinum 8273CL	A2 G2	2.2	2.9	3.7
Prosesor Intel Xeon Skalabel (Skylake) Generasi Ke-1	Prosesor Intel Xeon Scalable Platinum 8173M	E2 `m1-megamem` Jenis mesin yang dioptimalkan untuk memori N1	2.0	2.7	3.5
Intel Xeon E7 (Broadwell E7)	Prosesor Intel Xeon E7-8880V4	`m1-ultramem` Jenis mesin yang dioptimalkan untuk memori	2.2	2.6	3.3
Intel Xeon E5 v4 (Broadwell E5)	Prosesor Intel Xeon E5-2696V4	E2 N1	2.2	2.8	3.7
Intel Xeon E5 v3 (Haswell)	Prosesor Intel Xeon E5-2696V3	N1	2.3	2.8	3.8
Intel Xeon E5 v2 (Ivy Bridge)	Prosesor Intel Xeon E5-2696V2	N1	2.5	3.1	3.5
Intel Xeon E5 (Sandy Bridge)	Prosesor Intel Xeon E5-2689	N1	2.6	3.2	3,6

Jenis mesin ¹C4 yang menggunakan CPU Intel Granite Rapids memiliki frekuensi dasar 2,8, tetapi vPMU akan menampilkan 2,3 untuk tujuan kompatibilitas.

Jenis mesin ²N2 yang memiliki 96 vCPU atau lebih memerlukan CPU Intel Ice Lake.

Prosesor AMD

Prosesor AMD memberikan performa dan skalabilitas yang dioptimalkan menggunakan SMT. Di hampir semua kasus, Compute Engine menggunakan dua thread per inti, dan setiap vCPU adalah satu thread. H4D dan Tau T2D adalah pengecualian ketika Compute Engine menggunakan satu thread per inti dan setiap vCPU dipetakan ke inti fisik. Jenis mesin instance komputasi Anda menentukan jumlah vCPU dan jumlah memori yang dialokasikan ke instance.

Prosesor CPU	SKU Prosesor	Seri mesin yang didukung	Frekuensi dasar (GHz)	Frekuensi efektif (GHz)	Frekuensi peningkatan maksimum (GHz)
AMD EPYC Turin Generasi ke-5	AMD EPYC 9B45	C4D G4 H4D (Pratinjau)	2,7	3,5	4.1
AMD EPYC Genoa Generasi ke-4	AMD EPYC 9B14	C3D	2.6	3.3	3.7
AMD EPYC Milan Generasi ke-3	AMD EPYC 7B13	E2 Tau T2D N2D C2D	2.45	2.8	3.5
AMD EPYC Rome Generasi ke-2	AMD EPYC 7B12	E2 N2D	2.25	2.7	3.3

Perilaku frekuensi

Tabel sebelumnya menjelaskan spesifikasi hardware CPU yang tersedia dengan Compute Engine, tetapi perhatikan hal-hal berikut:

Frekuensi: Frekuensi PC, atau kecepatan clock, mengukur jumlah siklus yang dijalankan CPU per detik, yang diukur dalam GHz (gigahertz). Umumnya, frekuensi yang lebih tinggi menunjukkan performa yang lebih baik. Namun, desain CPU yang berbeda menangani instruksi secara berbeda, sehingga CPU lama dengan kecepatan clock yang lebih tinggi dapat dikalahkan oleh CPU baru dengan kecepatan clock yang lebih rendah karena arsitektur yang lebih baru menangani instruksi secara lebih efisien.
Frekuensi dasar: Frekuensi CPU berjalan saat sistem tidak ada aktivitas atau mengalami beban ringan. Saat dijalankan pada frekuensi dasarnya, CPU akan menarik lebih sedikit daya dan menghasilkan panas lebih sedikit.

Lingkungan tamu instance komputasi mencerminkan frekuensi dasar, terlepas dari frekuensi CPU yang sebenarnya berjalan.
Frekuensi turbo all-core: Frekuensi saat setiap CPU biasanya berjalan saat semua core dalam soket tidak ada aktivitas pada waktu yang sama. Workload yang berbeda menempatkan permintaan yang berbeda pada CPU sistem. Teknologi Boost mengatasi perbedaan ini dan membantu proses beradaptasi dengan permintaan workload dengan meningkatkan frekuensi CPU.
- Sebagian besar instance komputasi mendapatkan frekuensi turbo all-core, meskipun hanya frekuensi dasar yang diiklankan ke lingkungan tamu.
- Prosesor Ampere Altra Arm dapat memberikan performa yang lebih dapat diprediksi karena frekuensi untuk prosesor Arm selalu berupa frekuensi turbo all-core.
- Instance C4 dapat berjalan pada frekuensi turbo all-core-max dengan menyetel kolom AdvancedMachineFeature ke ALL_CORE_MAX. Jika kolom ini tidak disetel, instance akan berjalan pada setelan default, yaitu frekuensi tidak terbatas.
  
  Setelan ALL_CORE_MAX tidak tersedia dengan instance komputasi C4D atau C4A.
Frekuensi turbo maks: Frekuensi yang ditargetkan CPU saat ditekan oleh aplikasi yang menuntut seperti video game atau aplikasi pemodelan desain. Ini adalah frekuensi single-core maksimum yang dicapai CPU tanpa overclocking.
Teknologi pengelolaan daya prosesor: Prosesor Intel mendukung beberapa teknologi untuk mengoptimalkan konsumsi daya. Teknologi ini dibagi menjadi dua kategori, atau status:
- Status C adalah status saat CPU mengurangi atau menonaktifkan fungsi yang dipilih.
- Status P memberikan cara untuk menskalakan frekuensi dan tegangan yang digunakan prosesor untuk mengurangi konsumsi daya CPU.
Semua jenis mesin C4, dan jenis mesin C2 (30, 60 vCPU), C2D (56, 112 vCPU), dan M2 (208, 416 vCPU) tertentu mendukung petunjuk status C yang disediakan instance melalui petunjuk MWAIT.

Instance Compute Engine tidak menyediakan fasilitas apa pun untuk kontrol status P pelanggan.

Fitur CPU

Produsen chip menambahkan teknologi canggih untuk komputasi, grafis, virtualisasi, dan pengelolaan memori ke CPU yang mereka buat. Google Cloud mendukung penggunaan beberapa fitur lanjutan ini dengan Compute Engine.

Advanced Vector Extensions

Advanced Vector Extensions (AVX) adalah ekstensi single instruction, multiple data (SIMD) untuk arsitektur set petunjuk x86 bagi mikroprosesor dari Intel dan Advanced Micro Devices (AMD). AVX menyediakan petunjuk baru dan skema pengodean baru.

Untuk mengetahui informasi selengkapnya, lihat Advanced Vector Extensions.

AVX tersedia dengan semua prosesor x86 yang digunakan oleh Compute Engine.

Advanced Vector Extensions (AVX2)

AVX2 (juga dikenal sebagai Haswell New Instructions) memperkenalkan penambahan berikut pada AVX:

Memperluas sebagian besar instruksi SSE dan AVX bilangan bulat vektor menjadi 256 bit
Menambahkan dukungan untuk Gather, yang memungkinkan elemen vektor dimuat dari lokasi memori yang tidak berdekatan
Permutasi apa pun ke apa pun dengan perincian DWORD dan QWORD
Pergeseran vektor

AVX2 tersedia dengan platform CPU berikut:

Prosesor Intel Xeon E5 v3 (Haswell) dan yang lebih baru
Semua prosesor AMD

Advanced Vector Extensions (AVX512)

AVX-512 memperluas AVX ke dukungan 512-bit menggunakan encoding awalan EVEX. AVX-512 menyediakan akselerasi bawaan untuk workload berat yang melibatkan pemrosesan berbasis vektor yang berat. Register besar untuk akselerator AVX-512 mendukung 32 bilangan floating point presisi ganda dan 64 bilangan floating point presisi tunggal, selain delapan bilangan bulat 64-bit dan 16 bilangan bulat 32-bit.

Untuk mengetahui informasi selengkapnya tentang AVX-512, lihat Apa yang dimaksud dengan Intel AVX-512?.

AVX-512 tersedia dengan platform CPU berikut:

Prosesor Intel Xeon Scalable (Skylake) Generasi ke-1 dan prosesor yang lebih baru
Prosesor AMD EPYC Genoa Generasi ke-4 dan yang lebih baru

Advanced Matrix Extensions

Intel Advanced Matrix Extensions (AMX) adalah ekstensi arsitektur set instruksi (ISA) baru yang dirancang untuk mempercepat workload kecerdasan buatan (AI) dan machine learning (ML). AMX memperkenalkan petunjuk baru yang dapat digunakan untuk melakukan operasi perkalian matriks dan konvolusi, yang merupakan dua operasi paling umum dalam AI dan ML.

AMX memperkenalkan register 2 dimensi yang disebut kartu, yang dapat digunakan akselerator untuk menjalankan operasi. AMX dimaksudkan sebagai arsitektur yang dapat diperluas. Akselerator pertama yang diterapkan disebut unit pengganda matriks kartu (TMUL). Setiap inti CPU dari prosesor Sapphire Rapids memiliki unit AMX TMUL independen.

Untuk mengetahui detail teknis tentang Intel AMX, lihat Dukungan Intel AMX pada 5.16. Intel menawarkan tutorial tentang AMX di Contoh Kode: Intel Advanced Matrix Extensions (Intel AMX) - Fungsi Intrinsik.

AMX tersedia dengan prosesor Intel Xeon generasi ke-4 (Sapphire Rapids) dan yang lebih baru. AMX tidak tersedia dengan prosesor AMD atau Arm.

Persyaratan untuk menggunakan AMX

Instruksi Intel AMX memiliki persyaratan software minimum tertentu seperti:

Untuk image kustom, AMX didukung dengan kernel Linux versi 5.16 atau yang lebih baru.
Compute Engine menawarkan dukungan untuk AMX dalam image publik berikut:
- CentOS Stream 9
- Container-Optimized OS 109 LTS atau yang lebih baru
- RHEL 8 (build terbaru) atau yang lebih baru
- Rocky Linux 8 (build terbaru) atau yang lebih baru
- Ubuntu 22.04 atau yang lebih baru
- Windows Server 2022 atau yang lebih baru
Tensorflow 2.9.1 atau yang lebih baru
Ekstensi Intel untuk Pengoptimalan Intel untuk PyTorch

Fitur CPU yang tersedia untuk instance bare metal

Selain menawarkan semua resource komputasi mentah server, instance bare metal yang berjalan di Prosesor Intel Xeon Scalable generasi ke-4 dan yang lebih baru dapat menggunakan beberapa akselerator dan offload khusus fungsi di dalamnya:

Intel-QAT: Intel QuickAssist Technology (Intel QAT) mempercepat kompresi, enkripsi, dan dekripsi
Intel-DLB: Intel Dynamic Load Balancer (Intel DLB) membantu mempercepat antrean data
Intel IAA: Intel In-Memory Analytics Accelerator (Intel IAA) meningkatkan performa pemrosesan kueri.
Intel DSA: Intel Data Streaming Accelerator (Intel DSA) membantu menyalin dan memindahkan data lebih cepat.

Confidential Computing

Untuk melindungi data Anda saat sedang digunakan, platform CPU yang mendukung teknologi Confidential Computing dapat digunakan untuk membuat instance Confidential VM.

Untuk mempelajari lebih lanjut persyaratan pembuatan instance Confidential VM, lihat Konfigurasi yang didukung.

Langkah berikutnya

Pelajari Kelompok mesin lebih lanjut.
Pelajari lebih lanjut instance Compute Engine.
Pelajari image lebih lanjut.
Pelajari cara Menentukan platform CPU minimum.

Coba sendiri

Jika Anda baru pertama kali menggunakan Google Cloud, buat akun untuk mengevaluasi performa Compute Engine dalam skenario dunia nyata. Pelanggan baru mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.

Coba Compute Engine gratis