Ringkasan penyimpanan untuk cluster GKE


Dokumen ini mencakup opsi penyimpanan yang didukung GKE dan beberapa pertimbangan utama dalam memilih opsi terbaik untuk kebutuhan bisnis Anda. Untuk menentukan kelompok mesin yang sesuai dengan pilihan Anda, lihat Perbandingan seri mesin.

GKE mendukung jenis penyimpanan dan integrasi berikut:

Block storage (Persistent Disk)

Volume Persistent Disk adalah perangkat penyimpanan jaringan tahan lama yang dikelola oleh Compute Engine dan dapat diakses cluster GKE Anda seperti disk fisik di desktop atau server. Jika cluster memerlukan ruang penyimpanan tambahan, Anda dapat memasang lebih banyak volume Persistent Disk ke node Anda atau mengubah ukuran volume Persistent Disk yang ada. Anda dapat mengizinkan GKE menyediakan PersistentVolumes secara dinamis yang didukung oleh Persistent Disk, atau Anda dapat menyediakan disk secara manual.

Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard.

Secara default, volume Persistent Disk merupakan resource zona (disimpan di satu zona dalam region). Anda dapat membuat volume Persistent Disk regional (disimpan di dua zona dalam region yang sama). Anda juga dapat memasang volume Persistent Disk sebagai hanya baca ke beberapa node secara bersamaan. Cara ini didukung untuk volume Persistent Disk zona dan regional.

Penyimpanan Persistent Disk di GKE bersifat persisten. Artinya, data yang disimpan di disk Anda akan tetap ada meskipun Pod yang menggunakannya dihentikan.

Mengapa menggunakan penyimpanan Persistent Disk

Gunakan penyimpanan Persistent Disk jika cluster Anda memerlukan akses ke block storage berperforma tinggi, tahan lama, dan sangat tersedia. Volume Persistent Disk biasanya terpasang ke satu Pod. Opsi penyimpanan ini mendukung mode akses ReadWriteOnce. GKE menyediakan dukungan untuk mengonfigurasi volume Persistent Disk dengan berbagai opsi latensi dan performa, termasuk opsi berikut:

  • Persistent Disk Seimbang: Cocok untuk aplikasi perusahaan standar. Opsi ini memberikan keseimbangan antara performa dan biaya. Didukung oleh solid state drive (SSD). Opsi ini adalah opsi default dalam penyediaan volume dinamis pada cluster dan node yang menjalankan GKE 1.24 atau versi lebih baru.
  • Persistent Disk Performa: Cocok untuk analisis penyebaran skala, database, dan penyimpanan data ke dalam cache yang persisten. Opsi ini ideal untuk workload yang sensitif pada performa. Didukung oleh solid state drive (SSD).
  • Persistent Disk Standar: Cocok untuk workload big data dan komputasi besar. Opsi ini adalah jenis disk paling hemat biaya. Didukung oleh hard disk drive (HDD) standar.
  • Persistent Disk Ekstrem: Cocok untuk aplikasi perusahaan seperti SAP HANA dan Oracle. Opsi ini menawarkan performa tertinggi untuk memenuhi kebutuhan database dalam memori terbesar. Didukung oleh solid state drive (SSD). Untuk penggunaan yang memerlukan performa, jika performa Persistent Disk tidak cukup, gunakan disk Hyperdisk Ekstrem.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Block storage (Google Cloud Hyperdisk)

Volume Hyperdisk menggunakan block storage Google Cloud generasi berikutnya. Volume Hyperdisk memungkinkan Anda menyesuaikan performa block storage dengan workload Anda secara dinamis. Anda dapat mengonfigurasi operasi input/output per detik (IOPS) dan throughput secara independen untuk aplikasi Anda, serta beradaptasi dengan kebutuhan performa yang berubah seiring waktu.

Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard. Volume hyperdisk adalah resource zona, yang bergantung pada ketersediaan regional. Penyimpanan hyperdisk di GKE bersifat persisten. Artinya, data yang disimpan di disk Anda akan tetap bertahan meskipun Pod yang menggunakannya dihentikan.

Mengapa menggunakan penyimpanan Hyperdisk

Gunakan penyimpanan Hyperdisk jika Anda perlu mengubah ukuran dan menyesuaikan IOPS atau throughput secara dinamis. Volume Hyperdisk biasanya terpasang ke satu Pod. Opsi penyimpanan ini mendukung mode akses ReadWriteOnce. Anda dapat memilih opsi penyimpanan Hyperdisk untuk GKE berikut berdasarkan rasio kebutuhan performa-harga Anda:

  • Hyperdisk Balanced: Paling cocok untuk sebagian besar workload. Opsi ini adalah opsi yang baik untuk men-deploy sebagian besar aplikasi perusahaan dan lini bisnis, serta database dan server web.
  • Hyperdisk Throughput: Dioptimalkan untuk throughput tinggi yang hemat biaya. Ini adalah opsi yang tepat jika kasus penggunaan Anda menargetkan analisis penyebaran skala (misalnya, Hadoop atau Kafka), memulihkan data yang jarang diakses dari server cadangan, serta workload yang sensitif biaya dan berorientasi throughput.
  • Hyperdisk Extreme: Dioptimalkan untuk performa IOPS. Opsi ini tepat jika Anda men-deploy workload berperforma tinggi, seperti sistem pengelolaan database.
  • Hyperdisk ML: Dioptimalkan untuk beban kerja inferensi dan pelatihan AI/ML yang perlu memuat bobot model dengan cepat. Gunakan opsi ini untuk mengurangi idle resource GPU/TPU karena bottleneck latensi.

Opsi penyimpanan Hyperdisk didukung di cluster GKE Autopilot dan Standard.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Block storage (Hyperdisk Storage Pool)

Hyperdisk Storage Pool adalah kumpulan resource penyimpanan (kapasitas, throughput, dan IOPS) yang telah disediakan sebelumnya dan dapat digunakan oleh disk di cluster GKE Anda. Resource penyimpanan dibagikan di semua Hyperdisk yang Anda buat dalam kumpulan penyimpanan.

Cluster GKE Standard memungkinkan disk booting Hyperdisk (untuk sistem operasi) dan Hyperdisk terpasang (untuk penyimpanan data) menjadi bagian dari penyimpanan bersama. Cluster GKE Autopilot hanya mendukung Hyperdisk terpasang untuk penyimpanan.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Block storage efemeral dan raw (SSD Lokal)

Disk SSD lokal adalah drive fisik yang terpasang langsung ke node Anda. Disk ini dapat menawarkan performa yang lebih baik, tetapi bersifat efemeral. Setiap volume SSD Lokal terpasang ke node tertentu. Anda tidak dapat memindahkan volume ke node lain.

Opsi penyimpanan ini didukung di cluster GKE Standard. Dukungan autopilot untuk SSD Lokal tersedia dalam pratinjau di mesin A2 Ultra A100, pada cluster dan node pool yang menjalankan GKE 1.27 dan yang lebih baru.

Penyimpanan efemeral yang didukung penyimpanan SSD Lokal di GKE terikat dengan siklus proses Pod. Saat Pod Anda dihentikan, penyimpanan efemeral yang terkait dengan Pod tersebut juga akan dihapus.

Mengapa menggunakan SSD Lokal

Penggunaan penyimpanan SSD Lokal di cluster GKE cocok jika Anda memerlukan hot caching untuk database dan analisis real-time, atau penyimpanan efemeral yang dioptimalkan untuk flash yang menawarkan latensi terendah. Penyimpanan SSD lokal bisa menjadi sangat efektif sebagai lapisan cache di depan Cloud Storage untuk kasus penggunaan AI/ML, batch processing, analisis, dan database dalam memori.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Penyimpanan file

Filestore menyediakan sistem file bersama berbasis cloud untuk data tidak terstruktur, dengan akses network file system (NFS). Instance Filestore berfungsi sebagai server file di Google Cloud yang menyediakan penyimpanan tahan lama dengan akses ReadWriteMany untuk cluster GKE Anda. Instance Filestore dipisahkan dari host dan memerlukan sedikit pengoperasian manual. Failover workload berjalan lancar karena tidak ada operasi infrastruktur untuk memasang atau melepas volume.

Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard. Penyimpanan Filestore dengan tingkat layanan enterprise ditetapkan secara default ke ketersediaan regional, sedangkan tingkat layanan lainnya memiliki ketersediaan zona. Penyimpanan Filestore di GKE bersifat persisten, yang berarti data yang disimpan dalam instance Anda akan tetap ada meskipun Pod yang menggunakannya dihentikan.

Mengapa menggunakan penyimpanan Filestore

Gunakan penyimpanan Filestore jika aplikasi Anda memerlukan akses network file system (NFS) serta beberapa pembaca dan penulis. Opsi penyimpanan ini cocok jika kasus penggunaan Anda melibatkan sistem pengelolaan konten, migrasi aplikasi, analisis data, rendering, dan pemrosesan media.

Untuk efisiensi biaya tambahan, multishare Filestore untuk GKE memungkinkan Anda berbagi instance tingkat enterprise Filestore sebesar 10 GiB atau lebih dengan hingga 80 PersistentVolume.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Penyimpanan objek (Cloud Storage FUSE)

Cloud Storage adalah penyimpanan objek untuk data biner dan objek, blob, serta data tidak terstruktur. Driver CSI Cloud Storage FUSE mengelola integrasi Cloud Storage FUSE dengan Kubernetes API untuk menggunakan bucket Cloud Storage yang ada sebagai volume. Anda dapat menggunakan driver CSI Cloud Storage FUSE untuk memasang bucket sebagai sistem file pada node GKE.

Driver CSI Cloud Storage FUSE mendukung mode akses ReadWriteMany, ReadOnlyMany, dan ReadWriteOnce di cluster GKE Autopilot dan Standard. Objek Cloud Storage memiliki ketersediaan regional. Data Cloud Storage di GKE bersifat persisten. Artinya, data yang disimpan di bucket Anda akan tetap ada meskipun Pod yang menggunakannya dihentikan.

Mengapa menggunakan Cloud Storage FUSE

Opsi Cloud Storage FUSE cocok jika Anda memerlukan semantik file di depan Cloud Storage untuk portabilitas. Cloud Storage FUSE juga merupakan pilihan umum developer yang ingin menyimpan dan mengakses pelatihan machine learning (ML) serta data model sebagai objek di Cloud Storage.

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Database terkelola

Database terkelola, seperti Cloud SQL atau Spanner, memberikan pengurangan overhead operasional dan dioptimalkan untuk infrastruktur Google Cloud. Database terkelola lebih mudah dipelihara dan dioperasikan dibandingkan database yang Anda deploy langsung di Kubernetes.

Mengapa menggunakan database terkelola

Penggunaan database yang dikelola Google Cloud memungkinkan workload stateful Anda di GKE untuk mengakses data persisten sekaligus mengotomatiskan tugas pemeliharaan seperti mencadangkan, patching, dan penskalaan. Buatlah database, bangun aplikasi, dan izinkan Google Cloud menskalakannya untuk Anda. Namun, keunggulan ini juga berarti Anda mungkin tidak memiliki akses ke versi spesifik database, ekstensi, atau ragam database yang tepat yang Anda inginkan.

GKE memberikan dukungan untuk terhubung dengan layanan database yang dikelola Google Cloud, yang meliputi:

Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:

Artefak build (Artifact Registry)

Artifact Registry adalah pengelola repositori untuk image container, paket OS, dan paket bahasa yang Anda bangun dan deploy.

Mengapa menggunakan Artifact Registry

Artifact Registry adalah opsi yang cocok untuk menyimpan image container pribadi, diagram Helm, dan artefak build lainnya.

Untuk mengambil image dari repositori Docker Artifact Registry ke GKE, lihat Men-deploy ke Google Kubernetes Engine dalam dokumentasi Artifact Registry.

Langkah selanjutnya