Mengelola insiden untuk kebijakan pemberitahuan berbasis SQL

Insiden adalah catatan kapan kondisi kebijakan pemberitahuan terpenuhi. Biasanya, saat kondisi terpenuhi, Cloud Monitoring akan membuka insiden dan mengirim notifikasi saat log diterima yang cocok dengan kondisi kebijakan pemberitahuan Anda. Namun, insiden tidak dibuat dalam situasi berikut:

  • Kebijakan ditangguhkan atau dinonaktifkan.
  • Rasio notifikasi maksimum akan melebihi batas 1 notifikasi setiap 5 menit untuk setiap kebijakan pemberitahuan berbasis log.
  • Total notifikasi harian akan melebihi batas 20 notifikasi per hari untuk setiap kebijakan pemberitahuan berbasis log.

Untuk setiap insiden, Monitoring membuat halaman Detail insiden yang memungkinkan Anda mengelola insiden, dan melaporkan informasi insiden yang dapat membantu Anda memecahkan masalah kegagalan. Misalnya, halaman Detail insiden menampilkan daftar ringkasan hasil kueri SQL dan insiden terkait.

Dokumen ini menjelaskan cara menemukan insiden. Panduan ini juga menjelaskan cara menggunakan halaman Detail insiden untuk mengelola insiden untuk kebijakan pemberitahuan berbasis SQL, yang mengevaluasi hasil kueri SQL yang dijalankan terhadap data dari grup entri log.

Sebelum memulai

Pastikan Anda memiliki izin yang diperlukan:

Untuk mendapatkan izin yang diperlukan agar dapat melihat dan mengelola insiden menggunakan konsol Google Cloud, minta administrator untuk memberi Anda peran IAM berikut pada project Anda:

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Untuk informasi selengkapnya tentang peran Cloud Monitoring, lihat Mengontrol akses dengan Identity and Access Management.

Menemukan insiden

Untuk melihat daftar insiden di project Google Cloud Anda, lakukan langkah berikut:

  1. Di konsol Google Cloud, buka halaman  Alerting:

    Buka Pemberitahuan

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

    • Panel Ringkasan mencantumkan jumlah insiden yang terbuka.
    • Panel Insiden menampilkan insiden terbuka terbaru. Untuk mencantumkan insiden terbaru dalam tabel, termasuk insiden yang ditutup, klik Tampilkan insiden tertutup.
  2. Untuk melihat detail insiden tertentu, pilih insiden dalam daftar.

    Halaman Detail insiden akan terbuka. Untuk informasi selengkapnya tentang halaman Detail insiden, lihat bagian Menyelidiki insiden di halaman ini.

Menemukan insiden yang lebih lama

Panel Insiden di halaman Pemberitahuan menampilkan insiden terbuka terbaru. Untuk menemukan insiden yang lebih lama, lakukan salah satu hal berikut:

  • Untuk melihat entri di tabel Insiden, klik  Lebih baru atau  Lebih lama.

  • Untuk membuka halaman Insiden, klik Lihat semua insiden. Dari halaman Insiden, Anda dapat melakukan semua hal berikut:

    • Tampilkan insiden yang ditutup: Untuk mencantumkan semua insiden dalam tabel, klik Tampilkan insiden yang ditutup.
    • Memfilter insiden: Untuk informasi tentang cara menambahkan filter, lihat Memfilter insiden.
    • Mengonfirmasi atau menutup insiden, atau menunda kebijakan pemberitahuannya. Untuk mengakses opsi ini, klik  Opsi lainnya di baris insiden, lalu pilih dari menu. Untuk informasi selengkapnya, lihat Mengelola insiden.

Filter insiden

Saat Anda memasukkan nilai di panel filter, hanya insiden yang cocok dengan filter yang dicantumkan dalam tabel Insiden. Jika Anda menambahkan beberapa filter, insiden hanya akan ditampilkan jika memenuhi semua filter.

Untuk menambahkan filter ke tabel insiden, lakukan tindakan berikut:

  1. Di halaman Insiden, klik  Filter table, lalu pilih properti filter. Properti filter mencakup semua hal berikut:

    • Status insiden
    • Nama kebijakan pemberitahuan
    • Kapan insiden dibuka atau ditutup
  2. Pilih nilai dari menu sekunder atau masukkan nilai di panel filter.

Menyelidiki insiden

Halaman Detail insiden berisi informasi yang dapat membantu Anda mengidentifikasi penyebab insiden.

Menjelajahi hasil kueri

Panel Total waktu slot yang digunakan per hari menunjukkan jumlah waktu yang dihabiskan slot BigQuery yang Anda pesan untuk menjalankan kueri SQL untuk kebijakan pemberitahuan selama 24 jam terakhir.

Panel Hasil kueri SQL menampilkan daftar ringkasan hasil kueri dari setiap kali Log Analytics menjalankan kueri SQL dari kondisi kebijakan pemberitahuan. Secara default, daftar difilter agar hanya menampilkan kueri yang cocok dengan kondisi kebijakan pemberitahuan.

  • Untuk melihat kueri dan tabel hasil kueri dari waktu tertentu saat Log Analytics menjalankan kueri, klik nilai dari kolom Waktu eksekusi kueri.
  • Untuk beralih antara hanya menampilkan hasil kueri yang cocok dengan kondisi kebijakan pemberitahuan dan semua kueri yang dijalankan Log Analytics dari kebijakan pemberitahuan, klik Hanya tampilkan kueri yang cocok dengan kondisi pemberitahuan.

Melihat informasi tambahan

Bagian Dokumentasi menampilkan template dokumentasi untuk notifikasi yang Anda berikan saat membuat kebijakan pemberitahuan. Informasi ini mungkin mencakup deskripsi tentang apa yang dipantau oleh kebijakan pemberitahuan dan menyertakan tips untuk mitigasi. Untuk informasi selengkapnya, lihat Memberikan anotasi pada notifikasi menggunakan dokumentasi yang ditentukan pengguna.

Jika Anda tidak mengonfigurasi dokumentasi untuk kebijakan pemberitahuan, panel Dokumentasi akan menampilkan "Tidak ada dokumentasi yang dikonfigurasi".

Untuk membantu menemukan masalah mendasar di seluruh aplikasi, Anda dapat menjelajahi insiden yang terkait dengan kondisi kebijakan pemberitahuan lainnya.

Bagian Insiden Terkait menampilkan daftar insiden lain yang dibuat saat kondisi kebijakan pemberitahuan terpenuhi.

Mengelola Insiden

Insiden berada dalam salah satu status berikut:

  •  Terbuka: Kondisi kebijakan pemberitahuan berbasis SQL terpenuhi, dan insiden masih terbuka. Jika kondisi yang sama terpenuhi lagi dan sudah ada insiden yang terbuka, insiden baru tidak akan dibuka.

  •  Terkonfirmasi: Insiden terbuka dan telah ditandai secara manual sebagai terkonfirmasi. Biasanya, status ini menunjukkan bahwa insiden sedang diselidiki.

  •  Ditutup: Anda telah menutup insiden secara manual, atau insiden ditutup secara otomatis setelah periode penutupan otomatis berakhir.

Mengonfirmasi insiden

Sebaiknya tandai insiden sebagai dikonfirmasi saat Anda mulai menyelidiki penyebab insiden.

Untuk menandai insiden sebagai ditanggapi, lakukan tindakan berikut:

  1. Di panel Incidents pada halaman Alerting, klik See all incidents.
  2. Di halaman Insiden, temukan insiden yang ingin Anda konfirmasi, lalu lakukan salah satu hal berikut:

    • Klik  Opsi lainnya, lalu pilih Konfirmasi.
    • Buka halaman detail untuk insiden, lalu klik Konfirmasi insiden.

Menunda kebijakan pemberitahuan

Untuk mencegah Pemantauan membuat insiden dan mengirim notifikasi selama jangka waktu tertentu, tunda kebijakan pemberitahuan terkait. Saat Anda menunda kebijakan pemberitahuan, insiden yang terkait dengan kebijakan pemberitahuan akan tetap terbuka, tetapi tidak menyebabkan notifikasi lebih lanjut. Insiden ditutup berdasarkan durasi penutupan otomatis kebijakan pemberitahuan.

Untuk menunda notifikasi insiden yang Anda lihat, lakukan tindakan berikut:

  1. Di halaman Detail insiden, klik Kebijakan Tunda.

  2. Pilih durasi penundaan. Setelah Anda memilih durasi penundaan, penundaan akan segera dimulai.

Anda juga dapat menunda kebijakan pemberitahuan dari halaman Incidents dengan menemukan insiden yang ingin Anda tunda, mengklik  More options, lalu memilih Snooze. Anda dapat menunda kebijakan pemberitahuan selama pemadaman untuk mencegah notifikasi lebih lanjut selama proses pemecahan masalah.

Menutup insiden

Anda dapat mengizinkan Pemantauan menutup insiden untuk Anda, atau Anda dapat menutup insiden.

Pemantauan akan otomatis menutup insiden saat durasi tutup otomatis untuk kebijakan pemberitahuan berakhir. Secara default, durasi penutupan otomatis adalah 7 hari. Durasi penutupan otomatis minimum adalah 30 menit.

Untuk menutup insiden, lakukan tindakan berikut:

  1. Di panel Incidents pada halaman Alerting, klik See all incidents.
  2. Di halaman Insiden, temukan insiden yang ingin Anda tutup, lalu lakukan salah satu tindakan berikut:

    • Klik  Lihat lainnya, lalu pilih Tutup insiden.
    • Buka halaman Incident details untuk insiden tersebut, lalu klik Close incident.
Jika Anda melihat pesan Unable to close incident, coba lagi dalam beberapa menit. Anda tidak dapat langsung menutup insiden baru karena kondisi yang menyebabkan insiden masih dianggap aktif oleh sistem pemberitahuan.

Batas dan retensi data

Untuk mengetahui informasi tentang batas dan periode retensi insiden, lihat Batas untuk pemberitahuan.

Langkah selanjutnya