Membuat kebijakan pemberitahuan berbasis metrik untuk SAP di Google Cloud

Untuk memantau sistem SAP di Google Cloud, Anda dapat menyiapkan Kebijakan pemberitahuan Cloud Monitoring yang memberi tahu administrator SAP Anda potensi kesalahan konfigurasi atau kegagalan resource.

Dokumen ini menjelaskan beberapa masalah umum ketersediaan tinggi dan menunjukkan cara membuat untuk mereka, atau gunakan contoh pemberitahuan sebagai referensi untuk membuat notifikasi kustom Anda sendiri. Contoh pemberitahuan yang dijelaskan dalam dokumen ini menggunakan Bahasa Kueri Pemantauan (MQL) untuk membuat kueri metrik yang dihasilkan oleh Agen Google Cloud untuk SAP. Meskipun secara default pemberitahuan ini berlaku untuk semua sistem SAP di project Google Cloud tertentu, Anda dapat menyesuaikan pemberitahuan untuk memfilter SID yang diperlukan atau menyesuaikan waktu yang berlalu untuk memicu pemberitahuan.

Untuk informasi tentang cara kerja pemberitahuan Cloud Monitoring, lihat Ringkasan Pemberitahuan.

Sebelum memulai

Mengimpor kebijakan pemberitahuan yang telah ditetapkan

Google Cloud menyediakan kebijakan pemberitahuan yang telah ditetapkan yang dapat Anda impor dan menyiapkan pemberitahuan untuk beberapa masalah umum HA. Untuk informasi selengkapnya, lihat bagian berikut:

Mengimpor pemberitahuan untuk deteksi batasan lokasi

Saat Anda memindahkan resource secara manual di cluster Pacemaker menggunakan cluster perintah, maka sumber daya itu mendapatkan kendala, atau preferensi klien diatur ke lebih memilih node tertentu. Situasi seperti itu dapat menghambat sumber daya untuk gagal jika terjadi pemadaman layanan. Untuk informasi selengkapnya, lihat Memindahkan Satu Resource di dokumentasi ClusterLabs.

Untuk mendapatkan notifikasi tentang situasi semacam itu di sistem HA SAP Anda yang berjalan pada Google Cloud, Anda dapat mengimpor kebijakan pemberitahuan yang telah ditentukan Pacemaker: Location constraint detected

Kebijakan pemberitahuan ini memberi tahu saat batasan berbasis preferensi terdeteksi dan merujuk administrator SAP pada "Afinitas node yang tidak disengaja yang mendukung node tertentu" bagian dari Memecahkan masalah konfigurasi ketersediaan tinggi untuk SAP kami. Kebijakan ini menggunakan metrik Pemantauan Proses workload.googleapis.com/sap/validation/pacemaker yang dikumpulkan oleh Agen Google Cloud untuk SAP.

Untuk mengimpor kebijakan pemberitahuan ini di project Google Cloud Anda dengan menggunakan Konsol Google Cloud, selesaikan langkah-langkah berikut:

  1. Di Konsol Google Cloud, buka  Integrasi halaman:

    Buka Integrations

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

  2. Filter untuk Google Cloud Agent for SAP, lalu klik Lihat Detail.
  3. Buka tab Alerts.
  4. Pilih Pacemaker: Location constraint detected, lalu klik Tampilkan Opsi > Sesuaikan Kebijakan Pemberitahuan.
  5. (Opsional) Untuk mengonfigurasi pemberitahuan untuk satu atau beberapa sistem SAP tertentu, bukan semua sistem SAP di project Google Cloud Anda, perbarui pernyataan filter di Query editor sebagai berikut:
    1. Hapus karakter #.
    2. Tentukan SID yang diperlukan. Untuk menentukan beberapa SID, pisahkan SID menggunakan karakter |. Berikut ini adalah contoh bagaimana pernyataan filter tersebut akan terlihat seperti ini:
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Dalam contoh ini, ABC, XYZ, dan HDB adalah SID.

  6. (Opsional) Untuk menyesuaikan waktu yang berlalu sebelum memicu pemberitahuan, memperbarui Pernyataan window di Editor kueri untuk menentukan satuan ukuran yang Anda inginkan:
    1. Misalnya, untuk menyetel batas waktu 3 menit:
      | window 3m
  7. Di bagian Alert Details, buka Notifications and name .
  8. Pilih saluran notifikasi yang diperlukan.
  9. Tinjau pemberitahuan tersebut, lalu klik Create Policy.

Impor pemberitahuan untuk deteksi kegagalan resource

Dalam sistem HA Anda, jika agen resource yang berjalan gagal, Pacemaker akan mencoba hentikan agen itu dan mulai ulang. Jika operasi {i>restart<i} gagal karena alasan apa pun, Pacemaker menetapkan nilai failcount agen resource tersebut ke INFINITY (jika start-failure-is-fatal disetel ke true, yang merupakan default), lalu mencoba memulai agen pada {i>node<i} yang berbeda. Jika agen resource gagal dimulai di semua node, agen resource akan tetap berada dalam status Stopped. Kepada memulihkan agen resource ini kembali ke status operasional, administrator SAP harus menghapus total failcount agen resource secara manual. Untuk informasi selengkapnya tentang perilaku failcount Pacemaker, lihat Dokumentasi ClusterLabs.

Untuk mendapatkan notifikasi tentang situasi semacam itu di sistem HA SAP Anda yang berjalan pada Google Cloud, Anda dapat mengimpor kebijakan pemberitahuan yang telah ditentukan Pacemaker: Resource failed to start

Kebijakan pemberitahuan ini memberi tahu saat agen resource gagal dimulai dan tetap berada di status Stopped selama lebih dari 3 menit. Kebijakan ini merujuk SAP Anda administrator ke "Agen resource dihentikan" bagian dari Memecahkan masalah konfigurasi ketersediaan tinggi untuk SAP kami. Kebijakan ini menggunakan metrik Process Monitoring workload.googleapis.com/sap/cluster/failcounts, yang dikumpulkan oleh Agent Google Cloud untuk SAP.

Untuk mengimpor kebijakan pemberitahuan ini di project Google Cloud menggunakan konsol Google Cloud, selesaikan langkah-langkah berikut:

  1. Di Konsol Google Cloud, buka  Integrasi halaman:

    Buka Integrations

    Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.

  2. Filter untuk Google Cloud Agent for SAP, lalu klik Lihat Detail.
  3. Buka tab Alerts.
  4. Pilih Pacemaker: Resource failed to start, lalu klik Tampilkan Opsi &gt; Sesuaikan Kebijakan Pemberitahuan.
  5. (Opsional) Untuk mengonfigurasi pemberitahuan untuk satu atau beberapa sistem SAP tertentu alih-alih semua sistem SAP di project Google Cloud Anda, perbarui Pernyataan filter di Editor kueri sebagai berikut:
    1. Hapus karakter #.
    2. Tentukan SID yang diperlukan. Untuk menentukan beberapa SID, pisahkan SID menggunakan karakter |. Berikut ini adalah contoh bagaimana pernyataan filter tersebut akan terlihat seperti ini:
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      Dalam contoh ini, ABC, XYZ, dan HDB adalah SID.

  6. (Opsional) Untuk menyesuaikan waktu yang berlalu sebelum memicu pemberitahuan, memperbarui Pernyataan window di Editor kueri untuk menentukan satuan ukuran yang Anda inginkan:
    1. Misalnya, untuk menyetel batas waktu 3 menit:
      | window 3m
  7. Di bagian Alert Details, buka Notifications and name .
  8. Pilih saluran notifikasi yang diperlukan.
  9. Tinjau pemberitahuan tersebut, lalu klik Create Policy.

Membuat kebijakan pemberitahuan kustom

Selain mengimpor kebijakan pemberitahuan yang telah ditetapkan, Anda dapat memperbaruinya ke membuat model kustom yang sesuai dengan kebutuhan Anda. Untuk melakukannya, Anda dapat menggunakan konsol Google Cloud, Cloud Monitoring API, Google Cloud CLI, atau Terraform.

Sebagai titik awal, sebaiknya Anda meninjau ringkasan contoh kebijakan pemberitahuan serta kebijakan pemberitahuan yang telah dikonfigurasi sebelumnya yang dijelaskan dalam dokumen ini.

Untuk informasi tentang cara mengelola atau mengubah kebijakan pemberitahuan, lihat Mengelola kebijakan pemberitahuan.