Tentang workload mode Autopilot di GKE Standard


Anda dapat menggunakan ComputeClasses untuk menjalankan workload Autopilot Google Kubernetes Engine (GKE) di cluster mode Standar GKE. Halaman ini menjelaskan metode yang dapat Anda gunakan untuk menjalankan workload dalam mode Autopilot dan membantu Anda memutuskan kapan harus menjalankan workload dalam mode tertentu.

Informasi ini ditujukan untuk orang-orang berikut:

  • Arsitek cloud yang ingin mengoptimalkan biaya operasional di organisasi.
  • Administrator platform yang ingin mengurangi overhead pengelolaan infrastruktur manual.
  • Site reliability engineer (SRE) yang ingin mengalihkan pemeliharaan, upgrade, dan penskalaan infrastruktur ke Google Cloud jika memungkinkan.

Anda seharusnya sudah memahami konsep berikut:

Tentang GKE Autopilot

Autopilot adalah mode operasi di GKE yang memungkinkan Google mengelola infrastruktur node, penskalaan, keamanan, dan fitur yang telah dikonfigurasi sebelumnya. Mode Autopilot dioptimalkan untuk menjalankan sebagian besar workload produksi di lingkungan yang menerapkan setelan yang direkomendasikan untuk keamanan, keandalan, performa, dan skalabilitas. Untuk memutuskan antara mode Autopilot dan mode Standard berdasarkan persyaratan Anda, lihat Tentang mode operasi GKE.

Anda dapat menggunakan mode Autopilot dengan cara berikut:

  • Buat cluster yang menggunakan mode Autopilot: Google mengelola seluruh cluster dan menerapkan praktik terbaik untuk otomatisasi, keandalan, keamanan, dan biaya.
  • Menjalankan workload dalam mode Autopilot di cluster Standar: Anda men-deploy ComputeClass Autopilot dan memilihnya di workload. Google mengelola node yang dibuat GKE untuk workload tertentu tersebut. Anda mengontrol cluster dan dapat menjalankan node pool Anda sendiri bersama dengan node yang dikelola GKE.

Tentang mode Autopilot untuk ComputeClasses

ComputeClass adalah resource kustom Kubernetes yang menentukan daftar konfigurasi node, seperti jenis mesin atau setelan fitur. Anda dapat memilih ComputeClass tertentu dalam spesifikasi workload Kubernetes. Saat workload yang memilih ComputeClass memerlukan node baru, GKE akan mencoba menyediakan node dengan salah satu konfigurasi yang dideklarasikan ComputeClass. GKE mencoba setiap konfigurasi di ComputeClass secara berurutan dan melakukan penggantian ke konfigurasi berikutnya jika pembuatan node gagal. Untuk mengetahui informasi selengkapnya, lihat Tentang ComputeClass kustom.

Untuk menjalankan workload Autopilot di cluster Standard GKE, Anda mengaktifkan mode Autopilot di ComputeClass dan memilih ComputeClass tersebut di workload tertentu. Google mengelola node baru yang disediakan oleh GKE untuk workload ini, mirip dengan cara Google mengelola node di cluster Autopilot. Sebagian besar manfaat dan fitur keamanan mode Autopilot berlaku untuk workload tersebut dan node host.

ComputeClass mode Autopilot memberi administrator cluster fleksibilitas tambahan untuk memilih tingkat kontrol yang Anda inginkan atas workload dan infrastruktur tertentu di cluster Anda, seperti dengan cara berikut:

  • Anda dapat mengizinkan GKE mengelola workload tertentu sepenuhnya dengan menjalankannya dalam mode Autopilot.
  • Anda tetap memiliki kontrol penuh atas workload dan infrastruktur yang tidak menggunakan mode Autopilot, seperti node pool yang dibuat secara manual.
  • Anda dapat menetapkan ComputeClass Autopilot sebagai default untuk cluster atau namespace Anda, sehingga workload berjalan dalam mode Autopilot kecuali jika workload secara eksplisit meminta opsi yang berbeda.

Opsi ini memungkinkan admin cluster memutuskan tingkat dan cakupan penggunaan Autopilot.

ComputeClass mode Autopilot memberi administrator cluster fleksibilitas tambahan untuk memilih tingkat kontrol yang Anda inginkan atas workload dan infrastruktur tertentu di cluster Anda, seperti dengan cara berikut:

  • Anda dapat mengizinkan GKE mengelola workload tertentu sepenuhnya dengan menjalankannya dalam mode Autopilot.
  • Anda tetap memiliki kontrol penuh atas workload dan infrastruktur yang tidak menggunakan mode Autopilot, seperti node pool yang dibuat secara manual.
  • Anda dapat menetapkan ComputeClass Autopilot sebagai default untuk cluster atau namespace Anda, sehingga workload berjalan dalam mode Autopilot kecuali jika workload secara eksplisit meminta opsi yang berbeda.

Opsi ini memungkinkan admin cluster memutuskan tingkat dan cakupan penggunaan Autopilot.

Manfaat ComputeClass Autopilot di cluster Standard

Menjalankan beberapa workload Anda dalam mode Autopilot memberikan manfaat seperti berikut:

  • Mengurangi biaya pengelolaan infrastruktur: Google mengupgrade, memelihara, mengonfigurasi, dan menyempurnakan node tertentu untuk Anda.
  • Menggunakan model harga Autopilot: workload yang menggunakan ComputeClass Autopilot ditagih menggunakan model harga Autopilot. Model penetapan harga ini mencakup penagihan per-Pod untuk workload yang tidak meminta hardware tertentu. Untuk mengetahui informasi selengkapnya, lihat bagian Harga.
  • Meningkatkan penskalaan dan postur keamanan: Workload Autopilot mendapatkan manfaat seperti akses ke platform komputasi yang dioptimalkan untuk container, batasan keamanan default yang ditingkatkan, dan penskalaan otomatis node berdasarkan permintaan resource. Node untuk workload tersebut menggunakan fitur seperti upgrade otomatis node dan perbaikan otomatis.
  • Meningkatkan keandalan: Perjanjian tingkat layanan (SLA) GKE mencakup tujuan tingkat layanan (SLO) waktu beroperasi Pod untuk Autopilot.

Banyak manfaat ini juga diberikan oleh cluster Autopilot, yang juga memberikan pengalaman yang lebih terkelola daripada cluster Standard dan mencakup beberapa manfaat keamanan, jaringan, dan pengelolaan resource. Untuk mengetahui informasi selengkapnya, lihat Ringkasan Autopilot.

Pemilihan hardware di ComputeClass Autopilot

Di ComputeClass Autopilot, Anda dapat memilih hardware tertentu untuk node (seperti GPU atau jenis mesin), atau Anda dapat mengizinkan GKE menempatkan Pod di platform komputasi umum yang dioptimalkan untuk container. Opsi tujuan umum direkomendasikan untuk sebagian besar workload produksi yang tidak memerlukan hardware tertentu agar dapat berjalan dengan baik.

Tabel berikut menjelaskan opsi konfigurasi ini, cara memilih salah satunya di ComputeClass, dan pengaruh pilihan ini terhadap model penagihan Anda:

Tabel 1. Pemilihan hardware di ComputeClass Autopilot
Persyaratan workload Konfigurasi ComputeClass yang direkomendasikan Model penagihan
Workload tujuan umum

Gunakan ComputeClass Autopilot yang memiliki aturan prioritas podFamily untuk menjalankan workload yang tidak memerlukan hardware tertentu di platform komputasi yang dioptimalkan untuk container Autopilot. Platform ini berfungsi dengan baik untuk beban kerja tujuan umum seperti berikut:

  • Server web
  • Tugas berbasis peristiwa
  • Batch processing
  • Pipeline CI/CD

ComputeClass Autopilot bawaan yang tersedia untuk cluster Standard menggunakan aturan prioritas podFamily.

Model penagihan berbasis pod
Workload yang memerlukan hardware tertentu

Gunakan ComputeClass yang menggunakan aturan konfigurasi hardware yang tersedia, seperti aturan machineFamily atau aturan gpus.

Model penagihan berbasis node

Konfigurasi Autopilot di ComputeClasses

Anda dapat menggunakan mode Autopilot di cluster Standard dengan menggunakan ComputeClass Autopilot bawaan yang disediakan GKE, atau dengan mengaktifkan Autopilot di ComputeClass kustom yang Anda buat. Bagian berikut menjelaskan setiap opsi.

ComputeClass Autopilot bawaan

GKE mengonfigurasi ComputeClass Autopilot tertentu untuk Anda. Anda dapat memilih class Autopilot bawaan ini di cluster yang memenuhi syarat. ComputeClass Autopilot bawaan di cluster Standard menggunakan aturan prioritas podFamily untuk menjalankan Pod di platform komputasi yang dioptimalkan untuk container. Untuk mengetahui informasi selengkapnya, lihat Tentang ComputeClass bawaan di GKE.

ComputeClass Autopilot Kustom

Anda dapat mengaktifkan Autopilot di ComputeClass kustom yang Anda kelola. Opsi ini berguna jika workload Anda memiliki persyaratan hardware tertentu. Kolom autopilot di resource kustom ComputeClass memungkinkan Anda mengaktifkan atau menonaktifkan Autopilot di ComputeClass tertentu.

Untuk mengaktifkan Autopilot di ComputeClass yang ada, Anda harus menghapusnya, mengupdate konfigurasi, lalu membuat ulang ComputeClass di cluster Anda. Perubahan Anda berlaku untuk node baru yang dibuat GKE untuk workload yang Anda deploy setelah memperbarui ComputeClass Autopilot.

Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Autopilot di class komputasi kustom, lihat Memilih hardware tertentu untuk Pod Autopilot.

Harga

Harga GKE Autopilot berlaku untuk node dan workload yang dibuat GKE untuk ComputeClass Autopilot. Tabel berikut menjelaskan model penagihan yang berlaku untuk berbagai konfigurasi ComputeClass Autopilot di cluster mode Standar.

Tabel 3. Harga untuk ComputeClass Autopilot
Model penagihan untuk berbagai konfigurasi ComputeClass
Model penagihan berbasis pod Model penagihan berbasis Pod berlaku untuk class komputasi Autopilot yang menggunakan aturan prioritas podFamily, bukan memilih mesin atau hardware tertentu. ComputeClass Autopilot bawaan, yang menggunakan aturan podFamily, menggunakan model penagihan berbasis Pod.
Model penagihan berbasis node Model penagihan berbasis node berlaku untuk class komputasi Autopilot yang secara eksplisit meminta konfigurasi node tertentu, seperti instance N2 atau GPU.

Harga Autopilot hanya berlaku untuk workload dan node yang menggunakan ComputeClass Autopilot. Cluster mode Standar dan node pool lain yang Anda jalankan akan terus menggunakan harga mode Standar GKE.

Setelan yang telah dikonfigurasi untuk node yang dikelola oleh Autopilot

Sebelum mengaktifkan mode Autopilot di ComputeClass, ketahui apa yang akan terjadi pada node yang dibuat GKE untuk menjalankan workload Autopilot. Google mengonfigurasi fitur dan batasan keamanan tertentu di node Autopilot. Akibatnya, workload yang di-deploy dan berfungsi dengan benar di node mode Standard Anda mungkin ditolak oleh mode Autopilot jika tidak memenuhi persyaratan keamanan Autopilot.

Tabel berikut menjelaskan konfigurasi fitur yang menggantikan setelan yang sesuai di cluster Standar Anda. Jika konfigurasi tidak ada dalam tabel ini, node Autopilot akan menggunakan setelan cluster Standard. Misalnya, Workload Identity Federation for GKE tidak ada dalam tabel ini, yang berarti setelan Workload Identity Federation for GKE pada cluster Standard berlaku untuk node Autopilot yang dibuat GKE.

Tabel 4. Setelan yang telah dikonfigurasi untuk node Autopilot
Fitur Setelan tingkat cluster standar Setelan node yang dikelola Autopilot
Upgrade dan pemeliharaan node

Dapat dikonfigurasi:

Telah dikonfigurasi sebelumnya:

  • Perbaikan otomatis node: diaktifkan
  • Upgrade otomatis node: diaktifkan
  • Strategi upgrade node: upgrade lonjakan dengan parameter yang telah dikonfigurasi sebelumnya
Penskalaan otomatis Dapat dikonfigurasi: Profil penskalaan otomatis Telah dikonfigurasi: Profil penskalaan otomatis optimize-utilization
Jaringan VPC native atau berbasis rute Memerlukan cluster VPC native
Keamanan

Dapat dikonfigurasi:

Telah dikonfigurasi sebelumnya:

Sistem operasi node

Dapat dikonfigurasi:

Telah dikonfigurasi sebelumnya:

Boot disk node

Dapat dikonfigurasi:

Dapat dikonfigurasi:

  • Jenis disk boot: menggunakan nilai di kolom ComputeClass storage.bootDiskType. Jika kolom ini tidak disetel, GKE akan menetapkan jenis disk booting sebagai berikut:
    • Jika ComputeClass menggunakan aturan podFamily, GKE akan menggunakan disk pd-balanced.
    • Jika ComputeClass tidak menggunakan aturan podFamily, GKE menggunakan jenis disk boot default untuk cluster.
  • Ukuran boot disk: GKE menggunakan nilai di kolom storage.bootDiskSize class komputasi. Jika kolom ini tidak ditetapkan, GKE akan menetapkan ukuran disk booting sebagai berikut:
Metadata node

Permintaan resource untuk workload Autopilot

Agar workload Autopilot berjalan secara efisien, GKE menerapkan nilai minimum dan maksimum tertentu untuk permintaan CPU, memori, dan penyimpanan sementara di Pod Anda. GKE juga menerapkan permintaan default ke Pod yang tidak secara eksplisit meminta salah satu resource ini. Nilai spesifik untuk persyaratan resource minimum, maksimum, dan default dalam workload GKE Autopilot bervariasi berdasarkan jenis hardware yang digunakan Pod Anda.

Untuk penyimpanan efemeral, nilai default jika Anda tidak meminta penyimpanan efemeral adalah sama untuk semua ComputeClass dan pilihan hardware. Untuk mengetahui informasi selengkapnya, lihat Permintaan resource default.

Tabel berikut menyediakan link ke persyaratan CPU dan memori untuk permintaan Pod Anda, bergantung pada jenis hardware:

Tabel 5. Persyaratan CPU dan memori Autopilot
Jenis resource Permintaan minimum dan maksimum Permintaan default
Pod Tujuan Umum
Aturan prioritas podFamily
Lihat baris "Serbaguna" dalam tabel Batas minimum dan maksimum untuk ComputeClass. Lihat baris "General-purpose" di tabel Default requests for ComputeClasses.
GPU dan TPU Bergantung pada jenis dan jumlah akselerator hardware. Untuk mengetahui informasi selengkapnya, lihat Batas minimum dan maksimum untuk Accelerator ComputeClass. Bergantung pada jenis dan jumlah akselerator hardware. Untuk mengetahui informasi selengkapnya, lihat Permintaan default untuk akselerator.
Jenis mesin dan kelompok mesin Compute Engine tertentu
  • Minimum: tidak ada nilai minimum untuk CPU atau memori.
  • Maksimum: nilai maksimum adalah kapasitas resource instance Compute Engine.
Untuk jenis mesin atau kelompok mesin Compute Engine apa pun, permintaan default di baris "Tujuan umum" dalam tabel Permintaan default untuk ComputeClass.

Langkah berikutnya