Pencadangan untuk GKE


Pencadangan untuk GKE adalah layanan untuk mencadangkan dan memulihkan workload di cluster GKE. Pencadangan memiliki dua komponen:

  • Google Cloud API yang berfungsi sebagai bidang kontrol untuk layanan.
  • Add-on GKE (agen Pencadangan untuk GKE) yang harus diaktifkan di setiap cluster tempat Anda ingin melakukan operasi pencadangan dan pemulihan.

Pencadangan workload Anda dapat bermanfaat untuk pemulihan dari bencana, pipeline CI/CD, cloning workload, atau rencana upgrade. Dengan melindungi workload, Anda akan terbantu dalam mencapai tujuan titik pemulihan bisnis yang penting.

Pengantar

Setelah diaktifkan, layanan Pencadangan untuk GKE akan terintegrasi dengan UI GKE, Google Cloud CLI, dan REST API, yang menyediakan alur kerja yang konsisten untuk pengembangan dan operasi. Ada dua jenis data yang disalin dalam cadangan:

  • Cadangan konfigurasi: sekumpulan manifes resource Kubernetes yang diekstrak dari server API cluster yang sedang melakukan pencadangan, yang merekam status cluster.
  • Cadangan volume: sekumpulan cadangan volume yang sesuai dengan resource PersistentVolumeClaim yang ditemukan dalam cadangan konfigurasi.

Anda dapat memilih workload yang ingin dicadangkan atau dipulihkan, atau Anda dapat mencadangkan atau memulihkan semua workload. Anda dapat mencadangkan workload dari satu cluster dan memulihkannya ke cluster lain. Anda dapat menjadwalkan agar pencadangan otomatis dijalankan, sehingga Anda dapat merespons dengan cepat untuk memulihkan workload jika terjadi insiden.

Untuk memulihkan workload, Anda harus membuat ulang resource Kubernetes di cluster target. Setelah resource dibuat, pemulihan kemampuan beban kerja tunduk pada proses rekonsiliasi cluster (misalnya, Pod dijadwalkan ke node, lalu Pod dimulai pada node tersebut). Selama pemulihan, Anda dapat secara opsional menerapkan aturan transformasi yang digunakan untuk mencocokkan serangkaian resource dan mengganti nilai atribut saat ini pada resource tersebut dengan nilai baru.

Kombinasi pencadangan dan pemulihan selektif dengan substitusi dirancang untuk mengakomodasi dan mendukung berbagai skenario pencadangan dan pemulihan yang berbeda, misalnya:

  • Mencadangkan semua workload dalam cluster dan memulihkan ke dalam cluster terpisah untuk pemulihan dari bencana (disaster recovery).
  • Mencadangkan semua workload, tetapi roll back satu workload di cluster sumber secara selektif.
  • Mencadangkan resource dalam satu namespace dan clone ke namespace lain.
  • Memigrasikan atau meng-clone workload dari satu cluster ke cluster lain.
  • Mengubah parameter penyimpanan untuk workload (misalnya, pindahkan workload dari persistent disk zona ke persistent disk regional).

Anda harus membuat cluster target dengan layanan Pencadangan untuk GKE yang diaktifkan sebelum dapat mencadangkan atau memulihkan workload apa pun.

Arsitektur

Pencadangan untuk GKE terdiri dari dua komponen utama:

  • Layanan yang berjalan di Google Cloud dan mendukung REST API berbasis resource. Layanan ini berfungsi sebagai bidang kontrol untuk Pencadangan untuk GKE. Layanan ini mencakup elemen UI konsol Google Cloud yang berinteraksi dengan API ini.
  • Agen yang berjalan di setiap cluster tempat pencadangan atau pemulihan dilakukan. Agen menjalankan operasi pencadangan dan pemulihan dalam cluster ini dengan berinteraksi dengan API Pencadangan untuk GKE.

Diagram berikut menunjukkan hubungan antara berbagai komponen dari Pencadangan untuk GKE:

Arsitektur Pencadangan untuk GKE

Ringkasan layanan

Layanan Pencadangan untuk GKE menyediakan endpoint API yang dapat digunakan klien untuk berinteraksi. API Pencadangan untuk GKE, seperti kebanyakan Google Cloud API, beroperasi terhadap resource cloud khusus aplikasi dalam suatu hierarki resource. Pencadangan untuk GKE mengelola database resource khusus aplikasi ini dan metode API layanan yang sebagian besar terkait dengan membuat, membaca, memperbarui, atau menghapus operasi terhadap resource ini.

Ada dua jenis resource aktif utama dalam model resource cloud:

  • Backup: Merupakan cadangan bagian tertentu dari cluster GKE pada titik waktu tertentu. Pembuatan resource Backup akan memulai proses pencadangan (yang akhirnya menyimpan salinan resource Kubernetes target dan membuat snapshot volume persisten disk target). Menghapus Backup akan menghapus artefak tersimpan ini.
  • Restore: Merupakan pemulihan bagian yang dipilih dari Backup tertentu ke dalam cluster GKE. Membuat resource Restore akan memulai proses pemulihan. Menghapus Restore tidak akan memiliki efek samping, dan akan menghapus data pemulihan dari database.

Pencadangan untuk GKE juga mencakup dua jenis resource konfigurasi dan kontrol:

  • BackupPlan: resource induk untuk resource Backup yang mewakili serangkaian cadangan. Resource ini berisi konfigurasi pencadangan termasuk cluster sumber, pemilihan workload yang akan dicadangkan, dan region tempat artefak Backup yang dihasilkan berdasarkan rencana ini disimpan.
  • RestorePlan: menyediakan template pemulihan yang dapat digunakan kembali. Resource ini berisi konfigurasi pemulihan, termasuk cluster target tempat Anda ingin memulihkan cadangan, rencana pencadangan sumber, cakupan pemulihan, penanganan konflik, dan aturan transformasi.

Ringkasan agen

Agen Pencadangan untuk GKE di-deploy dan dijalankan di setiap cluster GKE yang Anda konfigurasi untuk dicadangkan oleh layanan Pencadangan untuk GKE. Agen bertanggung jawab untuk menjalankan aktivitas pencadangan dan pemulihan, misalnya:

  • Cadangan:

    • Mengokestrasi proses pencadangan.
    • Mengambil resource dari server Kubernetes API, membuat serialisasinya ke dalam arsip, dan menyimpan arsip tersebut.
    • Membuat cadangan volume dasar yang terkait dengan PersistentVolumeClaims.
  • Pemulihan:

    • Mengokestrasi proses pemulihan.
    • Mengambil arsip resource Kubernetes dari penyimpanan, mengekstrak resource yang dipilih, menerapkan modifikasi yang sesuai pada resource tersebut, dan membuatnya di cluster target.
    • Membuat volume dan menghubungkannya ke konfigurasi Kubernetes dari cluster target.

Administrator tidak berinteraksi dengan agen, karena agen didorong oleh resource Kubernetes kustom (BackupJob dan RestoreJob) yang otomatis dibuat di cluster oleh layanan Pencadangan untuk GKE sebagai respons terhadap pembuatan resource cloud dan pencadangan. Namun, administrator dapat memengaruhi orkestrasi cadangan dengan membuat resource Kubernetes ProtectedApplication opsional di cluster. Resource ProtectedApplication ini hanya ada bagi Pencadangan untuk GKE dan menyediakan opsi yang lebih mendetail untuk menentukan cakupan pencadangan dan pemulihan.

Lihat Penghentian agen pratinjau untuk mengetahui informasi tentang perbedaan antara agen versi pratinjau dan versi GA.

Apa yang tidak dicadangkan

Anda hanya dapat mencadangkan resource Kubernetes dan volume persisten yang mendasarinya dengan Pencadangan untuk GKE. Pencadangan untuk GKE tidak mencadangkan data berikut:

  • Informasi konfigurasi cluster GKE, seperti konfigurasi node, kumpulan node, ukuran cluster awal, atau fitur yang diaktifkan.
  • Image container yang dirujuk oleh suatu cadangan. Hanya resource Kubernetes yang mendeskripsikan workload dan merujuk ke image container yang dicadangkan. Jika image yang dirujuk oleh manifes beban kerja dalam cadangan dihapus dari repositori image-nya, pemulihan konfigurasi tersebut berikutnya tidak akan berhasil memulihkan beban kerja.
  • Informasi konfigurasi atau status layanan di luar cluster, seperti Cloud SQL atau load balancer eksternal.

Langkah selanjutnya