Prinsip ini dalam pilar keandalan Google Cloud Framework Arsitektur memberikan rekomendasi untuk merencanakan, membuat, dan mengelola redundansi resource, yang dapat membantu Anda menghindari kegagalan.
Prinsip ini relevan dengan cakupan area fokus keandalan.
Ringkasan prinsip
Setelah menentukan tingkat keandalan yang diperlukan, Anda harus mendesain sistem untuk menghindari titik kegagalan tunggal. Setiap komponen penting dalam sistem harus direplikasi di beberapa mesin, zona, dan region. Misalnya, database penting tidak dapat ditempatkan di satu region saja, dan server metadata tidak dapat di-deploy di satu zona atau region saja. Dalam contoh tersebut, jika satu zona atau region mengalami pemadaman layanan, sistem akan mengalami pemadaman layanan global.
Rekomendasi
Untuk membuat sistem redundan, pertimbangkan rekomendasi dalam subbagian berikut.
Mengidentifikasi domain kegagalan dan mereplikasi layanan
Petakan domain kegagalan sistem Anda, dari setiap VM ke region, dan desain untuk redundansi di seluruh domain kegagalan.
Untuk memastikan ketersediaan tinggi, distribusikan dan replikasi layanan serta aplikasi Anda di beberapa zona dan region. Konfigurasikan sistem untuk failover otomatis guna memastikan bahwa layanan dan aplikasi terus tersedia jika terjadi pemadaman layanan zona atau region.
Untuk contoh arsitektur multi-zona dan multi-region, lihat Mendesain infrastruktur yang andal untuk workload Anda di Google Cloud.
Mendeteksi dan mengatasi masalah dengan cepat
Lacak terus status domain kegagalan Anda untuk mendeteksi dan mengatasi masalah dengan cepat.
Anda dapat memantau status layanan Google Cloud saat ini di semua region menggunakan dasborGoogle Cloud Service Health. Anda juga dapat melihat insiden yang relevan dengan project Anda menggunakan Personalized Service Health. Anda dapat menggunakan load balancer untuk mendeteksi kondisi resource dan merutekan traffic ke backend yang berfungsi dengan baik secara otomatis. Untuk mengetahui informasi selengkapnya, lihat Ringkasan health check.
Menguji skenario failover
Seperti simulasi kebakaran, simulasikan kegagalan secara rutin untuk memvalidasi efektivitas strategi replika dan failover Anda.
Untuk mengetahui informasi selengkapnya, lihat Menyimulasikan pemadaman layanan zona untuk MIG regional dan Menyimulasikan kegagalan zona di cluster regional GKE.