Saat membuat virtual machine (VM) atau instance bare metal menggunakan Compute Engine, Anda menentukan seri mesin dan jenis mesin untuk instance. Setiap seri mesin dikaitkan dengan satu atau beberapa platform CPU. Jika ada beberapa platform CPU yang tersedia untuk seri mesin, Anda dapat memilih platform CPU minimum untuk instance komputasi.
Platform CPU menawarkan beberapa prosesor fisik, dan setiap prosesor ini disebut sebagai inti. Untuk prosesor yang tersedia di Compute Engine, satu core CPU dapat berjalan sebagai beberapa thread hardware melalui Simultaneous multithreading (SMT), yang dikenal pada prosesor Intel sebagai Intel Hyper-Threading Technology. Di Compute Engine, setiap thread hardware disebut CPU virtual (vCPU). Beberapa seri mesin, seperti C4A, T2D, dan H3, tidak menggunakan SMT, dan setiap vCPU mewakili inti. Saat vCPU dilaporkan ke VM karena menggunakan inti virtual yang berbeda, Compute Engine memastikan bahwa vCPU tersebut tidak pernah berbagi core fisik yang sama.
Jenis mesin instance komputasi Anda menentukan jumlah vCPU-nya, dan Anda dapat menyimpulkan jumlah inti CPU fisiknya menggunakan vCPU default per rasio inti untuk seri mesin tersebut:
- Untuk seri mesin C4A, Tau T2D, Tau T2A, dan H3, VM selalu memiliki satu vCPU per inti.
- Untuk semua seri mesin lainnya, instance komputasi memiliki dua vCPU per inti secara default.
Anda juga dapat menetapkan jumlah thread per core , ke nilai non-default, yang mungkin bermanfaat bagi beberapa beban kerja. Yang penting, saat Anda melakukannya, jenis mesin instance komputasi Anda tidak lagi mencerminkan jumlah vCPU yang benar. Sebaliknya, harga dan jumlah inti CPU fisik tetap sama untuk dua vCPU default per rasio inti, dan jumlah vCPU adalah setengah dari nilai yang ditunjukkan oleh jenis mesin.
Prosesor Arm
Untuk prosesor Arm, Compute Engine menggunakan satu thread per core. Setiap vCPU dipetakan ke inti fisik tanpa SMT.
Tabel berikut menjelaskan prosesor Arm yang tersedia untuk instance Compute Engine.
Prosesor CPU dan SKU | Seri dan jenis mesin yang didukung |
---|---|
Prosesor Axion™ Google | C4A |
Ampere Altra Q64-30 | Tau T2A |
Prosesor x86
Untuk sebagian besar prosesor x86, setiap vCPU diimplementasikan sebagai satu thread hardware. Seri mesin H3 adalah pengecualian, dengan satu vCPU mewakili satu inti fisik.
Prosesor Intel
Pada prosesor Intel Xeon, Intel Hyper-Threading Technology mendukung beberapa thread yang berjalan secara serentak pada setiap inti. Jenis mesin instance komputasi Anda menentukan jumlah vCPU dan memorinya.
Prosesor CPU | SKU Prosesor | Seri dan jenis mesin yang didukung | Frekuensi dasar (GHz) | Frekuensi turbo semua inti (GHz) | Frekuensi turbo maks inti tunggal (Ghz) |
---|---|---|---|---|---|
Prosesor Intel Xeon Scalable (Emerald Rapids) generasi ke-5 |
|||||
Prosesor Intel® Xeon® Platinum 8581C |
2.3 | 3.1 | 4.0 | ||
Prosesor Intel® Xeon® Platinum 8581C |
2.1 | 2.9 | 3.3 | ||
Prosesor Intel Xeon Scalable (Sapphire Rapids) generasi ke-4 |
Prosesor Intel® Xeon® Platinum 8490H | 1.9 | 2.9 | 3,5 | |
Prosesor Intel® Xeon® Platinum 8481C | 2.2 | 3.0 | 3.0 | ||
Prosesor Intel® Xeon® Platinum 8481C | 2.0 | 3.8 | 2.9 | ||
Prosesor Intel Xeon Scalable (Ice Lake) Generasi ke-3 |
Prosesor Intel® Xeon® Platinum 8373C |
2.6 | 3.4 | 3.5 | |
Prosesor Intel Xeon Skalabel (Cascade Lake) Generasi ke-2 |
|||||
Prosesor Intel® Xeon® Gold 6268CL | 2.8 | 3.4 | 3.9 | ||
Prosesor Intel® Xeon® Gold 6253CL | 3.1 | 3.8 | 3.9 | ||
Prosesor Intel® Xeon® Platinum 8280L | 2.5 | 3.4 | 4.0 | ||
Prosesor Intel® Xeon® Platinum 8273CL | 2.2 | 2.9 | 3.7 | ||
Prosesor Intel Xeon Skalabel (Skylake) Generasi Ke-1 |
Prosesor Intel® Xeon® Scalable Platinum 8173M | 2.0 | 2.7 | 3.5 | |
Intel Xeon E7 (Broadwell E7) | Prosesor Intel® Xeon® E7-8880V4 | 2.2 | 2.6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Prosesor Intel® Xeon® E5-2696V4 | 2.2 | 2.8 | 3.7 | |
Intel Xeon E5 v3 (Haswell) | Prosesor Intel® Xeon® E5-2696V3 | 2.3 | 2.8 | 3.8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Prosesor Intel® Xeon® E5-2696V2 | 2.5 | 3.1 | 3.5 | |
Intel Xeon E5 (Sandy Bridge) | Prosesor Intel® Xeon® E5-2689 | 2.6 | 3.2 | 3,6 |
*Jenis mesin N2 yang memiliki 96 vCPU atau lebih memerlukan CPU Intel Ice Lake.
Prosesor AMD
Prosesor AMD memberikan performa dan skalabilitas yang dioptimalkan menggunakan SMT. Di hampir semua kasus, Compute Engine menggunakan dua thread per core, dan setiap vCPU adalah satu thread. Tau T2D adalah pengecualian ketika Compute Engine menggunakan satu thread per inti dan setiap vCPU dipetakan ke inti fisik. Jenis mesin instance komputasi Anda menentukan jumlah vCPU dan memorinya.
Prosesor CPU | SKU Prosesor | Seri mesin yang didukung | Frekuensi dasar (GHz) | Frekuensi efektif (GHz) | Frekuensi peningkatan maksimum (GHz) |
---|---|---|---|---|---|
AMD EPYC Genoa Generasi ke-4 |
AMD EPYCTM 9B14 | 2.6 | 3.3 | 3.7 | |
AMD EPYC Milan Generasi ke-3 |
AMD EPYCTM 7B13 | 2.45 | 2.8 | 3.5 | |
AMD EPYC Rome Generasi ke-2 |
AMD EPYC™ 7B12 | 2.25 | 2.7 | 3.3 |
Perilaku frekuensi
Tabel sebelumnya menjelaskan spesifikasi hardware CPU yang tersedia dengan Compute Engine, tetapi perhatikan hal-hal berikut:
Frekuensi: Frekuensi PC, atau kecepatan clock, mengukur jumlah siklus yang dijalankan CPU per detik, yang diukur dalam GHz (gigahertz). Umumnya, frekuensi yang lebih tinggi menunjukkan performa yang lebih baik. Namun, desain CPU yang berbeda menangani instruksi secara berbeda, sehingga CPU lama dengan kecepatan clock yang lebih tinggi dapat dikalahkan oleh CPU baru dengan kecepatan clock yang lebih rendah karena arsitektur yang lebih baru menangani instruksi secara lebih efisien.
Frekuensi dasar: Frekuensi CPU berjalan saat sistem tidak ada aktivitas atau mengalami beban ringan. Saat dijalankan pada frekuensi dasarnya, CPU akan menarik lebih sedikit daya dan menghasilkan panas lebih sedikit.
Lingkungan tamu instance komputasi mencerminkan frekuensi dasar, terlepas dari frekuensi CPU yang sebenarnya berjalan.
Frekuensi turbo all-core: Frekuensi saat setiap CPU biasanya berjalan saat semua core dalam soket tidak ada aktivitas pada waktu yang sama. Workload yang berbeda menempatkan permintaan yang berbeda pada CPU sistem. Teknologi Boost mengatasi perbedaan ini dan membantu proses beradaptasi dengan permintaan workload dengan meningkatkan frekuensi CPU.
- Sebagian besar instance komputasi mendapatkan frekuensi all-core turbo, meskipun hanya frekuensi dasar yang diiklankan ke lingkungan tamu.
- Prosesor Ampere Altra Arm dapat memberikan performa yang lebih dapat diprediksi karena frekuensi untuk prosesor Arm selalu berupa frekuensi turbo all-core.
- VM C4 dapat
berjalan pada frekuensi turbo all-core-max dengan menetapkan
kolom AdvancedMachineFeature
ke
ALL_CORE_MAX
. Jika kolom ini tidak ditetapkan, VM akan berjalan pada setelan default, yaitu frekuensi yang tidak dibatasi.
Frekuensi turbo maks: Frekuensi yang ditargetkan CPU saat ditekan oleh aplikasi yang menuntut seperti video game atau aplikasi pemodelan desain. Ini adalah frekuensi single-core maksimum yang dicapai CPU tanpa overclocking.
Teknologi pengelolaan daya prosesor: Prosesor Intel mendukung beberapa teknologi untuk mengoptimalkan konsumsi daya. Teknologi ini dibagi menjadi dua kategori, atau status:
- Status C adalah status saat CPU mengurangi atau menonaktifkan fungsi yang dipilih.
- Status P memberikan cara untuk menskalakan frekuensi dan tegangan yang digunakan prosesor untuk mengurangi konsumsi daya CPU.
Semua jenis mesin C4, dan jenis mesin C2 (30, 60 vCPU), C2D (56, 112 vCPU), dan M2 (208, 416 vCPU) tertentu mendukung petunjuk status C yang disediakan instance melalui petunjuk
MWAIT
.Instance Compute Engine tidak menyediakan fasilitas apa pun untuk kontrol pelanggan atas status P.
Fitur CPU
Produsen chip menambahkan teknologi canggih untuk komputasi, grafis, virtualisasi, dan pengelolaan memori ke CPU yang mereka buat. Google Cloud mendukung penggunaan beberapa fitur lanjutan ini dengan Compute Engine.
Ekstensi Matriks Lanjutan (AMX)
Intel AMX adalah ekstensi arsitektur kumpulan petunjuk (ISA) baru yang dirancang untuk mempercepat workload kecerdasan buatan (AI) dan machine learning (ML). AMX memperkenalkan petunjuk baru yang dapat digunakan untuk melakukan operasi perkalian matriks dan konvolusi, yang merupakan dua operasi paling umum dalam AI dan ML.
AMX didukung pada prosesor Intel Xeon generasi ke-5 (dengan nama kode Emerald Rapids), yang mendukung seri VM tujuan umum C4, serta prosesor Intel Xeon generasi ke-4 (dengan nama kode Sapphire Rapids), yang mendukung VM tujuan umum C3 dan dioptimalkan untuk akselerator A3. Semua jenis mesin VM C4 dan C3 mendukung kumpulan petunjuk AMX.
AMX memperkenalkan register 2 dimensi yang disebut kartu, yang dapat digunakan akselerator untuk menjalankan operasi. AMX dimaksudkan sebagai arsitektur yang dapat diperluas. Akselerator pertama yang diterapkan disebut unit pengganda matriks kartu (TMUL). Setiap inti CPU dari prosesor Sapphire Rapids memiliki unit AMX TMUL independen.
Detail teknis selengkapnya tentang Intel AMX dapat ditemukan di Dukungan Intel AMX pada 5.16. Intel menawarkan tutorial tentang AMX di Contoh Kode: Intel® Advanced Matrix Extensions (Intel® AMX) - Fungsi Intrinsik.
Persyaratan untuk menggunakan AMX
Instruksi Intel AMX memiliki persyaratan software minimum tertentu seperti:
- Untuk image kustom, AMX didukung dengan kernel Linux versi 5.16 atau yang lebih baru.
- Compute Engine menawarkan dukungan untuk AMX dalam image publik berikut:
- CentOS Stream 8 atau yang lebih baru
- Container-Optimized OS 109 LTS atau yang lebih baru
- RHEL 8 (build terbaru) atau yang lebih baru
- Rocky Linux 8 (build terbaru) atau yang lebih baru
- Ubuntu 22.04 atau yang lebih baru
- Windows Server 2022 atau yang lebih baru
- Tensorflow 2.9.1 atau yang lebih baru
- Ekstensi Intel untuk Pengoptimalan Intel® untuk PyTorch
Untuk mengetahui ketersediaan regional VM C4 dan C3, lihat Region dan zona yang tersedia dan filter tabel agar hanya menampilkan jenis mesin C4 atau C3.
Fitur CPU yang tersedia untuk instance bare metal
Selain menawarkan semua resource komputasi mentah server, instance bare metal yang berjalan di Prosesor Intel Xeon Skalabel generasi ke-4 dapat menggunakan beberapa akselerator dan offload khusus fungsi bawaan:
- Intel-QAT: Intel QuickAssist Technology (Intel QAT) mempercepat kompresi, enkripsi, dan dekripsi
- Intel-DLB: Intel Dynamic Load Balancer (Intel DLB) membantu mempercepat antrean data
- Intel IAA: Intel In-Memory Analytics Accelerator (Intel IAA) meningkatkan performa pemrosesan kueri.
- Intel DSA: Intel Data Streaming Accelerator (Intel DSA) membantu menyalin dan memindahkan data lebih cepat.
Confidential Computing
Untuk melindungi data Anda saat sedang digunakan, platform CPU yang mendukung teknologi Confidential Computing dapat digunakan untuk membuat instance Confidential VM.
Untuk mempelajari lebih lanjut persyaratan pembuatan instance VM Confidential, lihat Konfigurasi yang didukung.
Langkah selanjutnya
- Pelajari Kelompok mesin lebih lanjut.
- Pelajari Instance virtual machine lebih lanjut.
- Pelajari image lebih lanjut.
- Pelajari cara Menentukan platform CPU minimum.
Coba sendiri
Jika Anda baru pertama kali menggunakan Google Cloud, buat akun untuk mengevaluasi performa Compute Engine dalam skenario dunia nyata. Pelanggan baru mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
Coba Compute Engine gratis