Cluster regional


Halaman ini menjelaskan cara kerja cluster regional di Google Kubernetes Engine (GKE).

Cluster regional meningkatkan ketersediaan cluster dengan mereplikasi bidang kontrol dan node di beberapa zona dalam satu region.

Cluster regional memberikan semua keuntungan cluster multi-zona dengan manfaat tambahan berikut:

  • Ketahanan dari kegagalan satu zona: Cluster regional tersedia di seluruh region, bukan di satu zona dalam satu region. Jika satu zona menjadi tidak tersedia, bidang kontrol dan resource Anda tidak akan terpengaruh.
  • Upgrade bidang kontrol berkelanjutan, perubahan ukuran bidang kontrol, dan penurunan periode nonaktif akibat kegagalan bidang kontrol. Dengan replika redundan bidang kontrol, cluster regional dapat memberikan ketersediaan Kubernetes API yang lebih tinggi sehingga Anda dapat mengakses bidang kontrol bahkan selama upgrade.

Cluster GKE Autopilot selalu bersifat regional. Jika menggunakan GKE Standard, Anda dapat memilih untuk membuat cluster regional, zona, atau multi-zona. Untuk mempelajari berbagai jenis ketersediaan cluster, lihat artikel Tentang pilihan konfigurasi cluster.

Dalam cluster regional, termasuk cluster Autopilot, bidang kontrol direplikasi di tiga zona dari satu region. GKE secara otomatis mereplikasi node di seluruh zona di region yang sama. Di cluster Standard dan node pool, Anda dapat secara manual menentukan zona eksekusi node. Semua zona harus berada dalam region yang sama dengan bidang kontrol.

Setelah membuat cluster regional, Anda tidak dapat mengubahnya menjadi cluster zona.

Cara kerja cluster regional

Cluster regional mereplikasi bidang kontrol dan node cluster di beberapa zona dalam satu region. Misalnya, dengan menggunakan konfigurasi default, cluster regional di region us-east1 membuat replika bidang kontrol dan node di tiga zona us-east1: us-east1-b, us-east1-c, dan us-east1-d. Jika terjadi penonaktifan infrastruktur, workload Autopilot akan terus berjalan dan GKE akan otomatis menyeimbangkan kembali node. Jika menggunakan cluster Standard, Anda harus menyeimbangkan kembali node secara manual atau menggunakan autoscaler cluster.

Batasan

  • Node pool default yang dibuat untuk cluster Standar regional terdiri dari sembilan node (tiga node per zona) yang tersebar merata di tiga zona dalam satu region. Untuk cluster publik, region akan memakai sembilan alamat IP. Anda dapat mengurangi jumlah node maksimal sebanyak satu per zona, jika diinginkan. Akun Penagihan Cloud yang baru dibuat hanya diberi delapan alamat IP per region sehingga Anda mungkin perlu meminta tambahan kuota untuk alamat IP yang sedang digunakan regional, bergantung pada ukuran cluster regional Anda. Jika alamat IP yang sedang digunakan terlalu sedikit, pembuatan cluster akan gagal.

  • Untuk menjalankan GPU di cluster regional Anda, pilih region yang memiliki minimal satu zona yang menyediakan GPU yang diminta. Anda harus menggunakan flag --node-locations saat membuat node pool untuk menentukan zona tersebut atau zona yang berisi GPU yang diminta.

    Jika region yang Anda pilih tidak memiliki minimal satu zona yang menyediakan GPU yang diminta, Anda mungkin akan melihat error seperti berikut:

    ERROR: (gcloud.container.clusters.create) ResponseError: code=400, message=
        (1) accelerator type "nvidia-tesla-k80" does not exist in zone us-west1-c.
        (2) accelerator type "nvidia-tesla-k80" does not exist in zone us-west1-a.
    

    Untuk mengetahui daftar lengkap region dan zona yang menyediakan GPU, lihat GPU di Compute Engine.

  • Zona untuk node pool mode Standard harus berada di region yang sama dengan bidang kontrol cluster. Jika perlu, Anda dapat mengubah zona cluster, agar semua node baru dan yang sudah ada dapat menjangkau zona tersebut.

Harga

Semua cluster Autopilot bersifat regional, dan tunduk pada model harga Autopilot.

Dalam mode Standard, cluster regional memerlukan lebih banyak kuota regional project Anda daripada cluster zona atau multi-zona yang serupa. Pastikan Anda memahami kuota dan Harga standar sebelum menggunakan cluster regional. Jika Anda mengalami error Insufficient regional quota to satisfy request for resource, ini mengindikasikan bahwa permintaan Anda melebihi kuota yang tersedia di region saat ini.

Selain itu, Anda juga akan dikenai biaya untuk traffic node ke node di seluruh zona. Misalnya, jika workload yang berjalan di satu zona perlu berkomunikasi dengan workload di zona lain, traffic lintas zona akan dikenai biaya. Untuk mengetahui informasi selengkapnya, lihat Traffic keluar antar-zona dalam region yang sama (per GB) di halaman harga Compute Engine.

Penyimpanan persisten di cluster regional

Persistent disk zona adalah resource zona, sedangkan persistent disk regional merupakan resource multi-zona. Saat menambahkan penyimpanan persisten kecuali jika zona ditentukan, GKE akan menetapkan disk ke satu zona acak. Untuk mempelajari cara mengontrol zona, lihat Zona di persistent disk.

Penskalaan otomatis cluster regional

Ingatlah selalu hal-hal berikut saat menggunakan autoscaler cluster untuk menskalakan node pool secara otomatis di cluster mode Standard regional.

Anda juga dapat mempelajari Batas penskalaan otomatis untuk cluster regional atau cara Autoscaler Cluster menyeimbangkan seluruh zona.

Pertimbangan ini hanya berlaku untuk cluster mode Standard yang memiliki autoscaler cluster.

Batas penskalaan penyediaan yang berlebihan

Untuk mempertahankan kapasitas jika terjadi kegagalan zona, Anda dapat mengizinkan GKE memberikan batas penskalaan secara berlebihan untuk menjamin tingkat ketersediaan minimum meskipun beberapa zona tidak tersedia.

Misalnya, jika penyediaan secara berlebihan untuk cluster tiga zona mencapai 150% (kelebihan kapasitas 50%), Anda dapat memastikan bahwa 100% traffic dirutekan ke zona yang tersedia jika sepertiga kapasitas cluster hilang. Dalam contoh sebelumnya, Anda akan melakukan hal ini dengan menentukan maksimum enam node per zona, bukan empat. Jika satu zona gagal, cluster akan diskalakan menjadi 12 node di zona yang tersisa.

Demikian pula, jika penyediaan secara berlebihan untuk cluster dua zona mencapai 200%, Anda dapat memastikan bahwa 100% traffic akan dirutekan kembali jika setengah kapasitas cluster hilang.

Anda dapat mempelajari autoscaler cluster lebih lanjut atau membaca FAQ untuk penskalaan otomatis di dokumentasi Kubernetes.

Langkah selanjutnya