Mengelola dan memantau infrastruktur Google Cloud Anda

Last reviewed 2023-11-13 UTC

Setelah men-deploy aplikasi ke produksi di Google Cloud, Anda mungkin perlu memodifikasi infrastruktur yang digunakannya. Misalnya, Anda mungkin perlu mengubah jenis mesin VM atau mengubah kelas penyimpanan bucket Cloud Storage. Bagian dari panduan keandalan infrastruktur Google Cloud ini merangkum panduan manajemen perubahan yang dapat Anda ikuti untuk mengurangi risiko keandalan resource infrastruktur. Bagian ini juga menjelaskan cara memantau ketersediaan infrastruktur Google Cloud.

Men-deploy perubahan infrastruktur secara bertahap

Saat Anda perlu mengubah infrastruktur Google Cloud sebanyak mungkin, deploy perubahan ke produksi secara bertahap. Misalnya, jika Anda perlu mengubah jenis mesin VM, maka deploy perubahan ke beberapa VM dalam satu zona, dan pantau efek perubahan tersebut. Jika Anda menemukan masalah, segera kembalikan infrastruktur ke keadaan stabil sebelumnya. Lakukan diagnosis dan selesaikan masalah, lalu mulai ulang proses deployment progresif. Setelah memastikan workload Anda berjalan seperti yang diharapkan, deploy perubahan secara bertahap di seluruh infrastruktur Anda.

Untuk mengetahui informasi selengkapnya mengenai strategi pengujian dan perubahan deployment yang andal pada infrastruktur dan aplikasi Google Cloud, lihat Strategi deployment dan pengujian aplikasi.

Mengontrol perubahan pada resource global

Saat Anda mengubah resource global seperti jaringan VPC dan load balancing global, berhati-hatilah saat memverifikasi perubahan sebelum men-deploy-nya ke produksi.

Karena resource global tahan terhadap pemadaman layanan pada tingkat zona dan region, Anda dapat memutuskan untuk menggunakan satu instance resource global tertentu dalam arsitektur Anda. Dalam deployment seperti itu, resource global bisa menjadi titik tunggal kegagalan. Misalnya, jika Anda tidak sengaja salah mengonfigurasi aturan penerusan load balancer global, frontend dapat berhenti menerima atau memproses permintaan pengguna. Dengan efektif, aplikasi tidak akan tersedia untuk pengguna dalam kasus ini meskipun backend utuh. Untuk menghindari situasi seperti itu, terapkan kontrol yang ketat pada perubahan di resource global. Misalnya, dalam proses peninjauan dan perubahan, Anda dapat mengklasifikasikan setiap perubahan pada resource global sebagai perubahan berisiko tinggi yang harus diverifikasi dan disetujui oleh peninjau tambahan.

Memantau ketersediaan infrastruktur Google Cloud

Anda dapat memantau status layanan Google Cloud saat ini di semua region menggunakan Dasbor Google Cloud Service Health. Anda juga dapat melihat histori kegagalan infrastruktur (disebut insiden) untuk setiap layanan. Halaman histori memberikan detail setiap insiden, seperti durasi insiden, zona dan region yang terpengaruh, layanan yang terpengaruh, serta solusi yang direkomendasikan.

Anda juga dapat melihat insiden yang relevan dengan project Anda menggunakan Personal Service Health. Service Health juga memungkinkan Anda meminta informasi insiden menggunakan API per project atau per organisasi, serta memungkinkan Anda mengonfigurasi pemberitahuan.

Google memberikan info terbaru secara rutin tentang status dari setiap insiden, termasuk perkiraan waktu untuk update berikutnya. Anda dapat secara terprogram mendapatkan update status untuk insiden menggunakan feed RSS. Untuk informasi selengkapnya, lihat Insiden dan Dasbor Google Cloud Service Health.