Meskipun gangguan layanan tidak dapat dihindari, komunikasi yang transparan dan awal sangat penting untuk mengevaluasi apa yang terjadi, terus memberi tahu pemangku kepentingan, dan menjalankan tindakan untuk meminimalkan dampak terhadap bisnis Anda.
Mengoperasikan aplikasi cloud yang andal adalah tanggung jawab bersama antaraGoogle Cloud dan developer aplikasi. Saat terjadi gangguan layanan, Google Cloud bertujuan untuk menyampaikan insiden dengan cepat dan memberikan penilaian dampak. Anda harus mengevaluasi cara menerima notifikasi, menindaklanjuti insiden yang muncul, dan mengelola dampaknya terhadap aplikasi Anda.
Personalized Service Health dapat membantu proses ini. Anda dapat berintegrasi dengan layanan ini dengan berbagai cara untuk mempelajari insiden yang muncul, mengevaluasi dampaknya terhadap aplikasi Anda, dan menerima info terbaru dari Google Cloud. Dokumen ini memberikan ringkasan tentang cara menerima sinyal gangguan layanan dari Google Cloud, termasuk rekomendasi tentang integrasi dengan layanan tersebut.
Menentukan tempat untuk melakukan integrasi
Google Cloud menyediakan produk berikut untuk membantu Anda memahami kondisi Google Cloud produk:
- Google Cloud Service Health - memberikan ringkasan seluruh platform tentang semua Google Cloud produk di semua lokasi. Fitur ini mencakup insiden dengan cakupan dan tingkat keparahan yang lebih besar, dan tersedia di:
- Personalized Service Health - memberikan tampilan yang dipersonalisasi dari Google Cloud
produk yang digunakan oleh project Anda atau di seluruh organisasi. Laporan ini mencakup
kisaran insiden yang lebih luas daripada yang diposting di Google Cloud Service Health.
Personalized Service Health tersedia di:
- Dasbor konsol, yang dapat diakses melalui konsol Google Cloud.
- Pemberitahuan
- Service Health API
Sebaiknya terintegrasi dengan Personalized Service Health untuk memberi Anda cakupan dan rentang opsi integrasi terbanyak.
Titik integrasi | Kasus penggunaan | Manfaat | Dependensi |
Dasbor konsol (Personalized Service Health) | Melihat gangguan aktif | Dipersonalisasi untuk project Anda, tersedia secara default | Pengelolaan Akses dan Identitas (IAM) Konsol Google Cloud |
Notifikasi (Personalized Service Health) | Notifikasi proaktif | Dipersonalisasi untuk project Anda, praktis, dan proaktif | IAM Cloud Logging Cloud Monitoring |
API (Personalized Service Health) | Mengintegrasikan dengan sistem atau alat lain | Dipersonalisasi untuk project atau organisasi Anda | IAM |
Memilih metode interaksi dengan Personalized Service Health
Anda harus mempertimbangkan Personalized Service Health dalam konteks model operasi, pemantauan, dan respons insiden yang Anda inginkan. Dengan mengevaluasi cara tim Anda menggunakan sinyal selama dan menjelang insiden, Anda dapat memutuskan cara Anda ingin menggunakan Personalized Service Health.
Tabel berikut menunjukkan cara Anda berinteraksi dengan Status Layanan yang Dipersonalisasi, bergantung pada cara penyiapannya.
Contoh skenario di organisasi Anda | Integrasi dengan Personalized Service Health | Contoh alat yang dapat Anda integrasikan |
Developer yang siap siaga untuk beberapa aplikasi | Notifikasi project individual
Dasbor konsol |
Google Cloud Observability, PagerDuty |
Respons insiden terpusat di seluruh organisasi | Integrasi API dengan sistem yang ada menggunakan OrganizationEvents API (v1, v1beta) | PagerDuty, dasbor kustom |
Platform internal untuk mengelola resource dan operasi cloud | Service Health API Notifikasi project individual Integrasi Service Health API dengan platform developer internal |
Backstage, Terraform |
Banyak project yang dikonfigurasi dan dikelola secara terprogram (Contoh: 1.000+) | Service Health API Notifikasi berbasis API otomatis |
Backstage, Terraform, PagerDuty |
Menggunakan Personalized Service Health selama insiden
Setelah Anda berintegrasi dengan Personalized Service Health dan mulai mendapatkan notifikasi pemberitahuan, Personalized Service Health akan memberikan informasi tentang gangguan Google Cloudyang dapat membantu Anda mengelola dampaknya.
Mendeteksi dan menentukan cakupan insiden
Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:
- Apakah ini masalah yang nyata?
- Dapatkah Anda memvalidasi dampaknya?
- Apa saja gejalanya?
- Pengguna, produk, atau bagian bisnis mana yang terpengaruh? Wilayah geografis apa?
Personalized Service Health membantu Anda memahami apakah masalah berasal dari project atau Google, sehingga Anda dapat menerapkan respons insiden yang sesuai. Dengan begitu, Anda dapat menemukan dan melihat informasi peristiwa sehingga dapat memantau peristiwa, produk yang terpengaruh, dan lokasi yang memengaruhi project Anda.
Berikut adalah langkah-langkah yang dapat Anda lakukan:
- Tinjau pemberitahuan, jika Anda telah menyiapkannya.
- Apa yang menyebabkan pemberitahuan ini diaktifkan?
- Bagaimana notifikasi ini sesuai dengan semua notifikasi khusus produk lainnya?
- Akses dasbor Service Health untuk project atau organisasi Anda. Anda dapat melihat peristiwa, produk yang terpengaruh, dan lokasi secara
sekilas, serta menjawab pertanyaan berikut:
- Project mana yang terpengaruh?
- Produk mana yang menjadi dependensi project Anda dan terpengaruh?
- Apakah peristiwa tersebut memengaruhi resource tertentu dalam lokasi tersebut?
- Tinjau peristiwa dan pahami cakupan, dampak, dan relevansinya terhadap project Anda.
- Identifikasi peristiwa yang tampaknya terkait dengan masalah yang Anda lihat.
- Temukan langkah-langkah verifikasi, mitigasi (jika tersedia), dan perkiraan waktu resolusi untuk peristiwa tersebut.
Personalized Service Health membantu Anda meninjau status dan dampak insiden saat ini yang memengaruhi project atau organisasi Anda, sehingga Anda dapat mengelola dan meresponsnya secara efisien. Misalnya, Anda dapat memprioritaskan secara efektif dengan mengidentifikasi insiden prioritas tertinggi secara akurat.
Mitigasi, selesaikan, atau eskalasikan insiden
Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:
- Bagaimana cara Anda mengatasi insiden tersebut?
- Dapatkah Anda memperbaikinya secara langsung?
- Haruskah Anda memulai failover sekarang, atau menunggu lebih lama?
- Siapa yang harus Anda beri tahu untuk memperbaikinya?
Personalized Service Health membantu Anda memahami dampak insiden terhadap project dan resource Anda, mendapatkan informasi tentang solusi yang tersedia, dan menerima info terbaru tentang estimasi waktu penyelesaian.
Memantau progres penyelesaian insiden
Ringkasan peristiwa di dasbor Status Layanan mengidentifikasi informasi utama seperti gejala dan solusi, yang diperlukan untuk mitigasi dan menunjukkan kapan status berubah. Detail ini memungkinkan Anda:
- Pantau ringkasan berjalan tentang potensi dampak saat situasi berkembang.
- Dapatkan info terbaru tentang perkembangan baru dan perkiraan waktu komunikasi atau pembaruan berikutnya.
- Melihat kapan gejala dipublikasikan.
- Lihat kapan solusi diidentifikasi.
- Lihat kapan status berubah menjadi Resolved.
Anda dapat melakukan tindakan berikut saat memantau progres:
- Tinjau solusi, jika tersedia.
- Terapkan respons insiden yang sesuai untuk project atau organisasi Anda.
- Lanjutkan memantau peristiwa tersebut hingga dimitigasi atau diselesaikan.
Kapan harus menghubungi Dukungan
Google mengetahui peristiwa yang muncul di dasbor Service Health. Untuk mengetahui tindakan Google terkait peristiwa, pilih peristiwa tersebut untuk melihat detailnya.
Jika masalah tampaknya tidak ditampilkan dalam peristiwa apa pun di dasbor, hubungi Dukungan.
Menggunakan Personalized Service Health dengan sumber informasi insiden lainnya
Terlepas dari penyiapan perusahaan Anda, gunakan Personalized Service Health sebagai sinyal tambahan saat mengevaluasi dampak insiden. Pastikan Anda dapat meninjau beberapa sumber informasi insiden sehingga Anda dapat memutuskan langkah berikutnya berdasarkan data dan bukti.
Alasan untuk menggunakan beberapa sumber informasi insiden meliputi:
- Produk Google Cloud mungkin mengalami insiden di beberapa lokasi, tetapi project Anda mungkin tidak terpengaruh karena berada di lokasi yang berbeda.
- Jika sistem penayangan Anda memiliki dua replika lengkap di zona terpisah dan produk Google Cloud kritis di satu zona gagal, Status Layanan yang Dipersonalisasi akan memberi tahu Anda tentang kegagalan tersebut. Namun, pengguna Anda mungkin tidak benar-benar terpengaruh dan Anda mungkin tidak perlu segera mengambil tindakan.
- Jika project Anda bergantung pada banyak produk Google Cloud dalam
lokasi, Kesehatan Layanan yang Dipersonalisasi tidak akan mengetahui:
- Jika project Anda mengharuskan semua produk berfungsi.
- Apakah project Anda akan terus berfungsi jika satu produk gagal.
- Jika seluruh aplikasi Anda terpengaruh jika satu atau beberapa produk gagal.
- Personalized Service Health itu sendiri juga dapat mengalami penurunan kualitas atau kegagalan. Untuk memverifikasi, Anda dapat memeriksa statusnya.
Anda harus menafsirkan sinyal dari Personalized Service Health sesuai dengan penyiapan Anda.