Terintegrasi dengan Personalized Service Health

Meskipun gangguan layanan tidak dapat dihindari, komunikasi yang transparan dan awal sangat penting untuk mengevaluasi apa yang terjadi, terus memberi tahu pemangku kepentingan, dan menjalankan tindakan untuk meminimalkan dampak terhadap bisnis Anda.

Mengoperasikan aplikasi cloud yang andal adalah tanggung jawab bersama antaraGoogle Cloud dan developer aplikasi. Saat terjadi gangguan layanan, Google Cloud bertujuan untuk menyampaikan insiden dengan cepat dan memberikan penilaian dampak. Anda harus mengevaluasi cara menerima notifikasi, menindaklanjuti insiden yang muncul, dan mengelola dampaknya terhadap aplikasi Anda.

Personalized Service Health dapat membantu proses ini. Anda dapat berintegrasi dengan layanan ini dengan berbagai cara untuk mempelajari insiden yang muncul, mengevaluasi dampaknya terhadap aplikasi Anda, dan menerima info terbaru dari Google Cloud. Dokumen ini memberikan ringkasan tentang cara menerima sinyal gangguan layanan dari Google Cloud, termasuk rekomendasi tentang integrasi dengan layanan tersebut.

Menentukan tempat untuk melakukan integrasi

Google Cloud menyediakan produk berikut untuk membantu Anda memahami kondisi Google Cloud produk:

  • Google Cloud Service Health - memberikan ringkasan seluruh platform tentang semua Google Cloud produk di semua lokasi. Fitur ini mencakup insiden dengan cakupan dan tingkat keparahan yang lebih besar, dan tersedia di:
  • Personalized Service Health - memberikan tampilan yang dipersonalisasi dari Google Cloud produk yang digunakan oleh project Anda atau di seluruh organisasi. Laporan ini mencakup kisaran insiden yang lebih luas daripada yang diposting di Google Cloud Service Health. Personalized Service Health tersedia di:

Sebaiknya terintegrasi dengan Personalized Service Health untuk memberi Anda cakupan dan rentang opsi integrasi terbanyak.

Titik integrasi Kasus penggunaan Manfaat Dependensi
Dasbor konsol (Personalized Service Health) Melihat gangguan aktif Dipersonalisasi untuk project Anda, tersedia secara default Pengelolaan Akses dan Identitas (IAM)
Konsol Google Cloud
Notifikasi (Personalized Service Health) Notifikasi proaktif Dipersonalisasi untuk project Anda, praktis, dan proaktif IAM
Cloud Logging
Cloud Monitoring
API (Personalized Service Health) Mengintegrasikan dengan sistem atau alat lain Dipersonalisasi untuk project atau organisasi Anda IAM

Memilih metode interaksi dengan Personalized Service Health

Anda harus mempertimbangkan Personalized Service Health dalam konteks model operasi, pemantauan, dan respons insiden yang Anda inginkan. Dengan mengevaluasi cara tim Anda menggunakan sinyal selama dan menjelang insiden, Anda dapat memutuskan cara Anda ingin menggunakan Personalized Service Health.

Tabel berikut menunjukkan cara Anda berinteraksi dengan Status Layanan yang Dipersonalisasi, bergantung pada cara penyiapannya.

Contoh skenario di organisasi Anda Integrasi dengan Personalized Service Health Contoh alat yang dapat Anda integrasikan
Developer yang siap siaga untuk beberapa aplikasi Notifikasi project individual

Dasbor konsol

Google Cloud Observability, PagerDuty
Respons insiden terpusat di seluruh organisasi Integrasi API dengan sistem yang ada menggunakan OrganizationEvents API (v1, v1beta) PagerDuty, dasbor kustom
Platform internal untuk mengelola resource dan operasi cloud Service Health API
Notifikasi project individual
Integrasi Service Health API dengan platform developer internal
Backstage, Terraform
Banyak project yang dikonfigurasi dan dikelola secara terprogram (Contoh: 1.000+) Service Health API
Notifikasi berbasis API otomatis
Backstage, Terraform, PagerDuty

Menggunakan Personalized Service Health selama insiden

Setelah Anda berintegrasi dengan Personalized Service Health dan mulai mendapatkan notifikasi pemberitahuan, Personalized Service Health akan memberikan informasi tentang gangguan Google Cloudyang dapat membantu Anda mengelola dampaknya.

Mendeteksi dan menentukan cakupan insiden

Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:

  • Apakah ini masalah yang nyata?
  • Dapatkah Anda memvalidasi dampaknya?
  • Apa saja gejalanya?
  • Pengguna, produk, atau bagian bisnis mana yang terpengaruh? Wilayah geografis apa?

Personalized Service Health membantu Anda memahami apakah masalah berasal dari project atau Google, sehingga Anda dapat menerapkan respons insiden yang sesuai. Dengan begitu, Anda dapat menemukan dan melihat informasi peristiwa sehingga dapat memantau peristiwa, produk yang terpengaruh, dan lokasi yang memengaruhi project Anda.

Berikut adalah langkah-langkah yang dapat Anda lakukan:

  1. Tinjau pemberitahuan, jika Anda telah menyiapkannya.
    • Apa yang menyebabkan pemberitahuan ini diaktifkan?
    • Bagaimana notifikasi ini sesuai dengan semua notifikasi khusus produk lainnya?
  2. Akses dasbor Service Health untuk project atau organisasi Anda. Anda dapat melihat peristiwa, produk yang terpengaruh, dan lokasi secara sekilas, serta menjawab pertanyaan berikut:
    • Project mana yang terpengaruh?
    • Produk mana yang menjadi dependensi project Anda dan terpengaruh?
    • Apakah peristiwa tersebut memengaruhi resource tertentu dalam lokasi tersebut?
  3. Tinjau peristiwa dan pahami cakupan, dampak, dan relevansinya terhadap project Anda.
  4. Identifikasi peristiwa yang tampaknya terkait dengan masalah yang Anda lihat.
  5. Temukan langkah-langkah verifikasi, mitigasi (jika tersedia), dan perkiraan waktu resolusi untuk peristiwa tersebut.

Personalized Service Health membantu Anda meninjau status dan dampak insiden saat ini yang memengaruhi project atau organisasi Anda, sehingga Anda dapat mengelola dan meresponsnya secara efisien. Misalnya, Anda dapat memprioritaskan secara efektif dengan mengidentifikasi insiden prioritas tertinggi secara akurat.

Mitigasi, selesaikan, atau eskalasikan insiden

Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:

  • Bagaimana cara Anda mengatasi insiden tersebut?
  • Dapatkah Anda memperbaikinya secara langsung?
  • Haruskah Anda memulai failover sekarang, atau menunggu lebih lama?
  • Siapa yang harus Anda beri tahu untuk memperbaikinya?

Personalized Service Health membantu Anda memahami dampak insiden terhadap project dan resource Anda, mendapatkan informasi tentang solusi yang tersedia, dan menerima info terbaru tentang estimasi waktu penyelesaian.

Memantau progres penyelesaian insiden

Ringkasan peristiwa di dasbor Status Layanan mengidentifikasi informasi utama seperti gejala dan solusi, yang diperlukan untuk mitigasi dan menunjukkan kapan status berubah. Detail ini memungkinkan Anda:

  • Pantau ringkasan berjalan tentang potensi dampak saat situasi berkembang.
  • Dapatkan info terbaru tentang perkembangan baru dan perkiraan waktu komunikasi atau pembaruan berikutnya.
  • Melihat kapan gejala dipublikasikan.
  • Lihat kapan solusi diidentifikasi.
  • Lihat kapan status berubah menjadi Resolved.

Anda dapat melakukan tindakan berikut saat memantau progres:

  • Tinjau solusi, jika tersedia.
  • Terapkan respons insiden yang sesuai untuk project atau organisasi Anda.
  • Lanjutkan memantau peristiwa tersebut hingga dimitigasi atau diselesaikan.

Kapan harus menghubungi Dukungan

Google mengetahui peristiwa yang muncul di dasbor Service Health. Untuk mengetahui tindakan Google terkait peristiwa, pilih peristiwa tersebut untuk melihat detailnya.

Jika masalah tampaknya tidak ditampilkan dalam peristiwa apa pun di dasbor, hubungi Dukungan.

Menggunakan Personalized Service Health dengan sumber informasi insiden lainnya

Terlepas dari penyiapan perusahaan Anda, gunakan Personalized Service Health sebagai sinyal tambahan saat mengevaluasi dampak insiden. Pastikan Anda dapat meninjau beberapa sumber informasi insiden sehingga Anda dapat memutuskan langkah berikutnya berdasarkan data dan bukti.

Alasan untuk menggunakan beberapa sumber informasi insiden meliputi:

  • Produk Google Cloud mungkin mengalami insiden di beberapa lokasi, tetapi project Anda mungkin tidak terpengaruh karena berada di lokasi yang berbeda.
  • Jika sistem penayangan Anda memiliki dua replika lengkap di zona terpisah dan produk Google Cloud kritis di satu zona gagal, Status Layanan yang Dipersonalisasi akan memberi tahu Anda tentang kegagalan tersebut. Namun, pengguna Anda mungkin tidak benar-benar terpengaruh dan Anda mungkin tidak perlu segera mengambil tindakan.
  • Jika project Anda bergantung pada banyak produk Google Cloud dalam lokasi, Kesehatan Layanan yang Dipersonalisasi tidak akan mengetahui:
    • Jika project Anda mengharuskan semua produk berfungsi.
    • Apakah project Anda akan terus berfungsi jika satu produk gagal.
    • Jika seluruh aplikasi Anda terpengaruh jika satu atau beberapa produk gagal.
  • Personalized Service Health itu sendiri juga dapat mengalami penurunan kualitas atau kegagalan. Untuk memverifikasi, Anda dapat memeriksa statusnya.

Anda harus menafsirkan sinyal dari Personalized Service Health sesuai dengan penyiapan Anda.