Dokumen ini mencakup opsi penyimpanan yang didukung GKE dan beberapa pertimbangan utama dalam memilih opsi terbaik untuk kebutuhan bisnis Anda. Untuk menentukan kelompok mesin yang sesuai dengan pilihan Anda, lihat Perbandingan seri mesin.
GKE mendukung jenis penyimpanan dan integrasi berikut:
- Memblokir penyimpanan menggunakan Persistent Disk
- Memblokir penyimpanan menggunakan Google Cloud Hyperdisk
- Memblokir penyimpanan menggunakan Penyimpanan Gabungan Hyperdisk
- Block storage efemeral dan raw menggunakan SSD Lokal
- Penyimpanan file
- Penyimpanan objek menggunakan Cloud Storage FUSE
- Database terkelola
- Artefak build
Block storage (Persistent Disk)
Volume Persistent Disk adalah perangkat penyimpanan jaringan tahan lama yang dikelola oleh Compute Engine dan dapat diakses cluster GKE Anda seperti disk fisik di desktop atau server. Jika cluster memerlukan ruang penyimpanan tambahan, Anda dapat memasang lebih banyak volume Persistent Disk ke node Anda atau mengubah ukuran volume Persistent Disk yang ada. Anda dapat mengizinkan GKE menyediakan PersistentVolumes secara dinamis yang didukung oleh Persistent Disk, atau Anda dapat menyediakan disk secara manual.
Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard.
Secara default, volume Persistent Disk merupakan resource zona (disimpan di satu zona dalam region). Anda dapat membuat volume Persistent Disk regional (disimpan di dua zona dalam region yang sama). Anda juga dapat memasang volume Persistent Disk sebagai hanya baca ke beberapa node secara bersamaan. Cara ini didukung untuk volume Persistent Disk zona dan regional.
Penyimpanan Persistent Disk di GKE bersifat persisten. Artinya, data yang disimpan di disk Anda akan tetap ada meskipun Pod yang menggunakannya dihentikan.
Mengapa menggunakan penyimpanan Persistent Disk
Gunakan penyimpanan Persistent Disk jika cluster Anda memerlukan akses ke block storage berperforma tinggi, tahan lama, dan sangat tersedia. Volume Persistent Disk biasanya terpasang ke satu Pod. Opsi penyimpanan ini mendukung mode akses ReadWriteOnce. GKE menyediakan dukungan untuk mengonfigurasi volume Persistent Disk dengan berbagai opsi latensi dan performa, termasuk opsi berikut:
- Persistent Disk Seimbang: Cocok untuk aplikasi perusahaan standar. Opsi ini memberikan keseimbangan antara performa dan biaya. Didukung oleh solid state drive (SSD). Opsi ini adalah opsi default dalam penyediaan volume dinamis pada cluster dan node yang menjalankan GKE 1.24 atau versi lebih baru.
- Persistent Disk Performa: Cocok untuk analisis penyebaran skala, database, dan penyimpanan data ke dalam cache yang persisten. Opsi ini ideal untuk workload yang sensitif pada performa. Didukung oleh solid state drive (SSD).
- Persistent Disk Standar: Cocok untuk workload big data dan komputasi besar. Opsi ini adalah jenis disk paling hemat biaya. Didukung oleh hard disk drive (HDD) standar.
- Persistent Disk Ekstrem: Cocok untuk aplikasi perusahaan seperti SAP HANA dan Oracle. Opsi ini menawarkan performa tertinggi untuk memenuhi kebutuhan database dalam memori terbesar. Didukung oleh solid state drive (SSD). Untuk penggunaan yang memerlukan performa, jika performa Persistent Disk tidak cukup, gunakan disk Hyperdisk Ekstrem.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk mempelajari jenis disk yang tersedia, lihat Opsi penyimpanan di dokumentasi Compute Engine.
- Driver CSI Persistent Disk Compute Engine adalah cara utama Anda untuk menggunakan penyimpanan Persistent Disk dengan GKE. Untuk mendapatkan petunjuk, baca artikel Menggunakan Driver CSI Persistent Disk Compute Engine.
Block storage (Google Cloud Hyperdisk)
Volume Hyperdisk menggunakan block storage Google Cloud generasi berikutnya. Volume Hyperdisk memungkinkan Anda menyesuaikan performa block storage dengan workload Anda secara dinamis. Anda dapat mengonfigurasi operasi input/output per detik (IOPS) dan throughput secara independen untuk aplikasi Anda, serta beradaptasi dengan kebutuhan performa yang berubah seiring waktu.
Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard. Volume hyperdisk adalah resource zona, yang bergantung pada ketersediaan regional. Penyimpanan hyperdisk di GKE bersifat persisten. Artinya, data yang disimpan di disk Anda akan tetap bertahan meskipun Pod yang menggunakannya dihentikan.
Mengapa menggunakan penyimpanan Hyperdisk
Gunakan penyimpanan Hyperdisk jika Anda perlu mengubah ukuran dan menyesuaikan IOPS atau
throughput secara dinamis. Volume Hyperdisk biasanya terpasang ke
satu Pod. Opsi penyimpanan ini mendukung
mode akses ReadWriteOnce
. Anda dapat memilih
opsi penyimpanan Hyperdisk untuk GKE berikut berdasarkan rasio kebutuhan performa-harga Anda:
- Hyperdisk Balanced: Paling cocok untuk sebagian besar workload. Opsi ini adalah opsi yang baik untuk men-deploy sebagian besar aplikasi perusahaan dan lini bisnis, serta database dan server web.
- Hyperdisk Throughput: Dioptimalkan untuk throughput tinggi yang hemat biaya. Ini adalah opsi yang tepat jika kasus penggunaan Anda menargetkan analisis penyebaran skala (misalnya, Hadoop atau Kafka), memulihkan data yang jarang diakses dari server cadangan, serta workload yang sensitif biaya dan berorientasi throughput.
- Hyperdisk Extreme: Dioptimalkan untuk performa IOPS. Opsi ini tepat jika Anda men-deploy workload berperforma tinggi, seperti sistem pengelolaan database.
- Hyperdisk ML: Dioptimalkan untuk beban kerja inferensi dan pelatihan AI/ML yang perlu memuat bobot model dengan cepat. Gunakan opsi ini untuk mengurangi idle resource GPU/TPU karena bottleneck latensi.
Opsi penyimpanan Hyperdisk didukung di cluster GKE Autopilot dan Standard.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk ringkasannya, lihat Tentang Hyperdisk untuk GKE.
- Untuk batas per disk, termasuk throughput dan IOP maksimum, lihat Batas Hyperdisk per disk dalam dokumentasi Compute Engine.
- Untuk menyiapkan dan menggunakan penyimpanan Hyperdisk Throughput dan Extreme di cluster Anda, lihat Menskalakan performa penyimpanan dengan Hyperdisk.
Block storage (Hyperdisk Storage Pool)
Hyperdisk Storage Pool adalah kumpulan resource penyimpanan (kapasitas, throughput, dan IOPS) yang telah disediakan sebelumnya dan dapat digunakan oleh disk di cluster GKE Anda. Resource penyimpanan dibagikan di semua Hyperdisk yang Anda buat dalam kumpulan penyimpanan.
Cluster GKE Standard memungkinkan disk booting Hyperdisk (untuk sistem operasi) dan Hyperdisk terpasang (untuk penyimpanan data) menjadi bagian dari penyimpanan bersama. Cluster GKE Autopilot hanya mendukung Hyperdisk terpasang untuk penyimpanan.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk ringkasannya, lihat Tentang Penyimpanan Gabungan Hyperdisk.
- Untuk menyiapkan Penyimpanan Gabungan Hyperdisk di cluster GKE Anda, lihat Mengoptimalkan performa dan biaya penyimpanan dengan Penyimpanan Gabungan Hyperdisk.
Block storage efemeral dan raw (SSD Lokal)
Disk SSD lokal adalah drive fisik yang terpasang langsung ke node Anda. Disk ini dapat menawarkan performa yang lebih baik, tetapi bersifat efemeral. Setiap volume SSD Lokal terpasang ke node tertentu. Anda tidak dapat memindahkan volume ke node lain.
Opsi penyimpanan ini didukung di cluster GKE Standard. Dukungan autopilot untuk SSD Lokal tersedia dalam pratinjau di mesin A2 Ultra A100, pada cluster dan node pool yang menjalankan GKE 1.27 dan yang lebih baru.
Penyimpanan efemeral yang didukung penyimpanan SSD Lokal di GKE terikat dengan siklus proses Pod. Saat Pod Anda dihentikan, penyimpanan efemeral yang terkait dengan Pod tersebut juga akan dihapus.
Mengapa menggunakan SSD Lokal
Penggunaan penyimpanan SSD Lokal di cluster GKE cocok jika Anda memerlukan hot caching untuk database dan analisis real-time, atau penyimpanan efemeral yang dioptimalkan untuk flash yang menawarkan latensi terendah. Penyimpanan SSD lokal bisa menjadi sangat efektif sebagai lapisan cache di depan Cloud Storage untuk kasus penggunaan AI/ML, batch processing, analisis, dan database dalam memori.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk ringkasannya, lihat Tentang penyimpanan SSD Lokal untuk GKE.
- Untuk menyiapkan dan menggunakan penyimpanan SSD Lokal di cluster Anda sebagai emptyDir, lihat Menyediakan dan menggunakan penyimpanan efemeral yang didukung SSD Lokal.
- Untuk menyiapkan dan menggunakan penyimpanan SSD Lokal di cluster Anda sebagai resource PersistentVolumes lokal, lihat Menyediakan dan menggunakan block storage raw yang didukung SSD Lokal.
Penyimpanan file
Filestore menyediakan sistem file bersama berbasis cloud untuk data
tidak terstruktur, dengan akses network file system (NFS). Instance Filestore
berfungsi sebagai server file di Google Cloud yang menyediakan penyimpanan tahan lama dengan
akses ReadWriteMany
untuk cluster GKE Anda. Instance Filestore dipisahkan dari host dan memerlukan sedikit pengoperasian manual. Failover workload
berjalan lancar karena tidak ada operasi infrastruktur untuk memasang atau melepas
volume.
Opsi penyimpanan ini didukung di cluster GKE Autopilot dan Standard. Penyimpanan Filestore dengan tingkat layanan enterprise ditetapkan secara default ke ketersediaan regional, sedangkan tingkat layanan lainnya memiliki ketersediaan zona. Penyimpanan Filestore di GKE bersifat persisten, yang berarti data yang disimpan dalam instance Anda akan tetap ada meskipun Pod yang menggunakannya dihentikan.
Mengapa menggunakan penyimpanan Filestore
Gunakan penyimpanan Filestore jika aplikasi Anda memerlukan akses network file system (NFS) serta beberapa pembaca dan penulis. Opsi penyimpanan ini cocok jika kasus penggunaan Anda melibatkan sistem pengelolaan konten, migrasi aplikasi, analisis data, rendering, dan pemrosesan media.
Untuk efisiensi biaya tambahan, multishare Filestore untuk GKE memungkinkan Anda berbagi instance tingkat enterprise Filestore sebesar 10 GiB atau lebih dengan hingga 80 PersistentVolume.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk ringkasannya, lihat Tentang dukungan Filestore untuk GKE.
- Driver CSI Filestore adalah cara utama Anda untuk menggunakan penyimpanan Filestore dengan GKE. Untuk mengetahui petunjuknya, baca Mengakses instance Filestore dengan driver CSI Filestore.
- Untuk petunjuk multishare Filestore, lihat Mengoptimalkan penyimpanan dengan multishare Filestore untuk GKE.
Penyimpanan objek (Cloud Storage FUSE)
Cloud Storage adalah penyimpanan objek untuk data biner dan objek, blob, serta data tidak terstruktur. Driver CSI Cloud Storage FUSE mengelola integrasi Cloud Storage FUSE dengan Kubernetes API untuk menggunakan bucket Cloud Storage yang ada sebagai volume. Anda dapat menggunakan driver CSI Cloud Storage FUSE untuk memasang bucket sebagai sistem file pada node GKE.
Driver CSI Cloud Storage FUSE mendukung mode akses ReadWriteMany
, ReadOnlyMany
, dan
ReadWriteOnce
di cluster GKE Autopilot dan Standard. Objek Cloud Storage
memiliki ketersediaan regional. Data Cloud Storage di
GKE bersifat persisten. Artinya, data yang disimpan di bucket Anda
akan tetap ada meskipun Pod yang menggunakannya dihentikan.
Mengapa menggunakan Cloud Storage FUSE
Opsi Cloud Storage FUSE cocok jika Anda memerlukan semantik file di depan Cloud Storage untuk portabilitas. Cloud Storage FUSE juga merupakan pilihan umum developer yang ingin menyimpan dan mengakses pelatihan machine learning (ML) serta data model sebagai objek di Cloud Storage.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Untuk ringkasannya, lihat Cloud Storage FUSE.
- Untuk menggunakan bucket Google Cloud di cluster Anda, lihat Mengakses bucket Cloud Storage dengan driver CSI Cloud Storage FUSE.
Database terkelola
Database terkelola, seperti Cloud SQL atau Spanner, memberikan pengurangan overhead operasional dan dioptimalkan untuk infrastruktur Google Cloud. Database terkelola lebih mudah dipelihara dan dioperasikan dibandingkan database yang Anda deploy langsung di Kubernetes.
Mengapa menggunakan database terkelola
Penggunaan database yang dikelola Google Cloud memungkinkan workload stateful Anda di GKE untuk mengakses data persisten sekaligus mengotomatiskan tugas pemeliharaan seperti mencadangkan, patching, dan penskalaan. Buatlah database, bangun aplikasi, dan izinkan Google Cloud menskalakannya untuk Anda. Namun, keunggulan ini juga berarti Anda mungkin tidak memiliki akses ke versi spesifik database, ekstensi, atau ragam database yang tepat yang Anda inginkan.
GKE memberikan dukungan untuk terhubung dengan layanan database yang dikelola Google Cloud, yang meliputi:
AlloyDB untuk PostgreSQL: Database yang kompatibel dengan PostgreSQL dan terkelola sepenuhnya dengan performa, ketersediaan, dan skala yang unggul untuk workload transaksional dan analisis. Lihat Menghubungkan dari Google Kubernetes Engine ke AlloyDB untuk PostgreSQL.
Cloud SQL: Database MySQL, PostgreSQL, dan SQL Server yang terkelola sepenuhnya. Lihat Menghubungkan dari Google Kubernetes Engine.
Spanner: Database relasional yang skalabel secara horizontal dengan konsistensi dan ketersediaan tinggi. Lihat Men-deploy aplikasi menggunakan GKE Autopilot dan Cloud Spanner.
Memorystore for Redis: Layanan penyimpanan data dalam memori yang terkelola sepenuhnya. Lihat Menghubungkan ke instance Redis dari cluster Google Kubernetes Engine.
Untuk mulai menggunakan opsi penyimpanan ini, lihat referensi berikut:
- Opsi database Google Cloud Anda, secara mendetail.
- Untuk pertimbangan tentang penggunaan database terkelola atau database dalam container yang dihosting di GKE, lihat Merencanakan deployment database di GKE.
Artefak build (Artifact Registry)
Artifact Registry adalah pengelola repositori untuk image container, paket OS, dan paket bahasa yang Anda bangun dan deploy.
Mengapa menggunakan Artifact Registry
Artifact Registry adalah opsi yang cocok untuk menyimpan image container pribadi, diagram Helm, dan artefak build lainnya.
Untuk mengambil image dari repositori Docker Artifact Registry ke GKE, lihat Men-deploy ke Google Kubernetes Engine dalam dokumentasi Artifact Registry.
Langkah selanjutnya
- Baca postingan blog Peta opsi penyimpanan di Google Cloud.
- Rancang strategi penyimpanan yang optimal untuk workload cloud Anda.
- Pahami cara menggunakan abstraksi penyimpanan Kubernetes di GKE: PersistentVolumes, StatefulSets.
- Lihat halaman referensi Data di GKE untuk mempelajari solusi data yang dapat Anda integrasikan dengan GKE.