Ringkasan Cloud Monitoring

Dokumen ini memberikan ringkasan tentang layanan yang disediakan Cloud Monitoring. Layanan ini dapat membantu Anda memahami perilaku, kondisi, dan performa aplikasi Anda serta layanan Google Cloud lainnya. Cloud Monitoring secara otomatis mengumpulkan dan menyimpan informasi performa untuk sebagian besar layanan Google Cloud . Anda dapat mengumpulkan metrik Prometheus menggunakan Google Cloud Managed Service for Prometheus. Jika menginstal Agen Operasional di virtual machine (VM) Compute Engine, Anda dapat mengumpulkan metrik dan log dari aplikasi Anda dan dari aplikasi pihak ketiga.

Layanan pemberitahuan, pengujian, dan visualisasi yang disediakan oleh Cloud Monitoring membantu Anda menjawab pertanyaan penting seperti berikut:

  • Berapa beban pada layanan saya?
  • Apakah situs saya merespons dengan benar?
  • Apakah layanan saya berperforma baik?

Cloud Monitoring menyediakan dukungan API dan konsol untuk sebagian besar layanannya di Google Cloud . Beberapa layanan juga mendukung Google Cloud CLI atau Terraform. Halaman referensi Cloud Monitoring API, seperti halaman alertPolicies.list, memungkinkan Anda bereksperimen dengan panggilan API langsung dari halaman referensi.

Layanan Cloud Monitoring

Cloud Monitoring menyediakan berbagai layanan yang dapat Anda gunakan untuk memahami kondisi dan performa aplikasi Anda, serta layanan Google Cloud lainnya yang Anda gunakan.

Notifikasi dan pemberitahuan

Agar menerima notifikasi saat nilai metrik performa memenuhi kriteria yang Anda tentukan, buat kebijakan pemberitahuan. Kebijakan pemberitahuan mencakup daftar orang atau grup yang akan menerima notifikasi. Monitoring mendukung saluran notifikasi umum, termasuk email, Cloud Mobile App, dan layanan seperti PagerDuty atau Slack. Misalnya, Anda dapat membuat kebijakan pemberitahuan agar Anda diberi tahu saat penggunaan CPU VM melebihi 80%.

Setiap notifikasi menyertakan informasi yang relevan tentang kegagalan, dan menyertakan link ke insiden. Insiden adalah catatan persisten yang menyimpan informasi yang dapat Anda gunakan untuk memecahkan masalah kegagalan. Biasanya, data mencantumkan status insiden, link ke log, diagram data metrik yang dicatat, label, dan durasi.

Layanan pemberitahuan terintegrasi dengan banyak layanan Google Cloud . Jika integrasi ini ada, Anda mungkin melihat panel yang mencantumkan pemberitahuan yang direkomendasikan, atau Anda mungkin melihat tombol pada diagram yang memungkinkan Anda membuat kebijakan pemberitahuan. Dalam kedua kasus tersebut, kebijakan pemberitahuan telah dikonfigurasi sebelumnya, Anda hanya menentukan daftar orang atau grup yang akan diberi tahu.

Anda dapat membuat dan mengelola kebijakan pemberitahuan menggunakan konsol Google Cloud , Cloud Monitoring API, Google Cloud CLI, atau Terraform.

Pemantauan dan validasi proaktif

Untuk menguji ketersediaan, konsistensi, dan performa layanan, aplikasi, halaman web, dan API Anda, buat monitor sintetis. Misalnya, Anda dapat memeriksa responsivitas endpoint HTTP, HTTPS, dan TCP dengan pemeriksaan uptime, lalu mendapatkan notifikasi saat endpoint gagal merespons. Anda juga dapat membuat pemeriksanya link rusak untuk meng-crawl halaman web, lalu memberi tahu Anda saat link rusak terdeteksi.

Anda dapat membuat dan mengelola monitor sintetis menggunakan konsol Google Cloud , Cloud Monitoring API, Google Cloud CLI, atau Terraform.

Visualisasi data

Untuk memvisualisasikan data guna melihat tren, mengidentifikasi pencilan, dan melihat detail lain tentang data, Anda dapat menggunakan layanan dasbor dan diagram:

  • Layanan dasbor akan otomatis membuat dasbor yang dikelolaGoogle Cloud

    Pengumpulan dan penyimpanan data

    Cloud Monitoring mengumpulkan dan menyimpan jenis data metrik berikut:

    • Metrik sistem dan aplikasi yang dikumpulkan oleh Agen Operasi tentang resource sistem dan aplikasi yang berjalan di instance Compute Engine. Anda dapat mengonfigurasi Agen Operasi untuk mengumpulkan metrik dari plugin pihak ketiga seperti server web Apache atau Nginx, atau database MongoDB atau PostgreSQL.
    • Metrik berbasis log yang mencatat informasi numerik tentang log yang ditulis ke Cloud Logging. Metrik berbasis log yang ditentukan Google mencakup jumlah error yang terdeteksi oleh layanan Anda dan jumlah total entri log yang diterima oleh project Google Cloud Anda. Anda juga dapat menentukan metrik berbasis log.

    Bahasa kueri

    Saat membuat kebijakan pemberitahuan atau diagram, Anda harus memberikan kueri yang menjelaskan data yang ingin dipantau atau dipetakan:

    • KonsolGoogle Cloud : Anda dapat membuat kueri dengan membuat pilihan dari menu, atau Anda dapat menulis kueri. Editor kueri tersedia untuk Prometheus Query Language (PromQL) dan Monitoring Query Language (MQL). Editor kueri menyediakan pemeriksaan dan saran sintaksis. Anda juga dapat menulis ekspresi Filter pemantauan.

    • Cloud Monitoring API: API ini mendukung Prometheus Query Language (PromQL), kueri MQL, dan ekspresi filter Monitoring.

    Memantau sistem besar

    Bagian ini menjelaskan cara mengelola resource sebagai kumpulan dan cara memantau metrik yang disimpan di beberapa project Google Cloud .

    Mengelola resource sebagai koleksi

    Untuk mengelola resource sebagai koleksi, bukan satu per satu, buat grup resource. Grup resource adalah kumpulan resource dinamis yang memenuhi beberapa kriteria yang Anda berikan. Saat Anda menambahkan dan menghapus resource, misalnya dengan menambahkan instance VM Compute Engine ke projectGoogle Cloud , keanggotaan dalam grup akan otomatis berubah. Berikut adalah contoh grup resource:

    • Instance Compute Engine yang namanya diawali dengan string prod-.
    • Resource dengan tag test-cluster.
    • Instance Amazon EC2 di region A atau region B.

    Setelah menentukan grup resource, Anda dapat memantau grup tersebut seolah-olah itu adalah satu resource. Misalnya, Anda dapat mengonfigurasi pemeriksaan uptime untuk memantau grup resource. Untuk diagram dan kebijakan pemberitahuan, Anda juga dapat memfilter berdasarkan nama grup.

    Untuk informasi selengkapnya, lihat Mengonfigurasi grup resource.

    Memantau metrik untuk beberapa project Google Cloud

    Untuk melihat dan memantau data deret waktu untuk beberapa projectGoogle Cloud dan akun AWS melalui satu antarmuka, konfigurasikan cakupan metrik multi-project.

    Secara default, halaman Cloud Monitoring di konsol Google Cloud hanya menyediakan akses ke deret waktu yang disimpan di project cakupan. Project cakupan adalah project yang Anda pilih dengan pemilih project konsolGoogle Cloud . Project cakupan menyimpan pemberitahuan, monitor sintetis, dasbor, dan grup pemantauan yang Anda konfigurasi.

    Project cakupan juga menghosting cakupan metrik. Cakupan metrik menentukan project dan akun yang metriknya dapat dilihat oleh project cakupan. Anda dapat mengonfigurasi cakupan metrik untuk menyertakan data deret waktu dari project Google Cloud lainnya dan dari akun AWS. Untuk informasi tentang cara mengubah cakupan metrik, lihat Mengonfigurasi cakupan metrik untuk beberapa project.

    Model data Cloud Monitoring

    Bagian ini memperkenalkan model data Cloud Monitoring:

    • Jenis metrik menjelaskan sesuatu yang diukur. Contoh jenis metrik mencakup penggunaan CPU VM dan persentase disk yang digunakan.

    • Deret waktu adalah struktur data yang berisi pengukuran metrik berstempel waktu dan informasi tentang sumber serta makna pengukuran tersebut.

    Berikut adalah beberapa detail tentang isi deret waktu:

    • Array points berisi pengukuran berstempel waktu.

      Berikut adalah contoh array points dengan dua nilai:

        "points": [
          {
            "interval": {
              "startTime": "2020-07-27T20:20:21.597143Z",
              "endTime": "2020-07-27T20:20:21.597143Z"
            },
            "value": {
              "doubleValue": 0.473005
            }
          },
          {
            "interval": {
              "startTime": "2020-07-27T20:19:21.597239Z",
              "endTime": "2020-07-27T20:19:21.597239Z"
            },
            "value": {
              "doubleValue": 0.473025
            }
          },
        ],
      

      Untuk memahami arti nilai, Anda perlu merujuk ke data lain yang disertakan dalam deret waktu dan definisi data tersebut.

    • Kolom resource menjelaskan komponen hardware atau software yang sedang dipantau. Di Cloud Monitoring, komponen hardware atau software disebut sebagai resource yang dimonitor. Contoh resource yang dipantau mencakup instance Compute Engine dan aplikasi App Engine. Untuk daftar resource yang dimonitor, lihat Daftar resource yang dimonitor.

      Berikut adalah contoh kolom resource:

        "resource": {
          "type": "gce_instance",
          "labels": {
            "instance_id": "2708613220420473591",
            "zone": "us-east1-b",
            "project_id": "sampleproject"
          }
        }
      
      • Kolom type mencantumkan resource yang dipantau sebagai gce_instance, yang menunjukkan bahwa pengukuran ini diambil pada instance VM Compute Engine.

      • Kolom labels berisi key-value pair yang memberikan informasi tambahan tentang resource yang dipantau. Untuk jenis gce_instance, label mengidentifikasi instance VM yang sedang dipantau.

    • Kolom metric menjelaskan hal yang diukur.

      Berikut adalah contoh kolom metric:

        "metric": {
          "labels": {
            "instance_name": "test"
          },
          "type": "compute.googleapis.com/instance/cpu/utilization"
        },
      
      • Untuk layanan Google Cloud , kolom type menentukan layanan dan apa yang dipantau. Dalam contoh ini, layanan Compute Engine mengukur penggunaan CPU. Jika kolom type diawali dengan custom atau external, metrik tersebut adalah metrik kustom atau metrik yang ditentukan oleh pihak ketiga.
      • Kolom labels berisi key-value pair yang memberikan informasi tambahan tentang pengukuran. Label ini ditentukan sebagai bagian dari MetricDescriptor, yang merupakan struktur data yang menentukan atribut data yang diukur. MetricDescriptor untuk metrik compute.googleapis.com/instance/cpu/utilization menyertakan label instance_name.
    • Kolom metricKind menjelaskan hubungan antara pengukuran yang berdekatan dalam deret waktu:

      • Metrik GAUGE menyimpan nilai hal yang diukur pada waktu tertentu—misalnya, catatan suhu per jam.

      • Metrik CUMULATIVE menyimpan nilai akumulasi dari hal yang diukur pada waktu tertentu—misalnya, odometer di kendaraan.

      • Metrik DELTA menyimpan perubahan nilai hal yang diukur selama jangka waktu tertentu—misalnya, ringkasan saham yang menunjukkan keuntungan atau kerugian saham.

    • Kolom valueType menjelaskan jenis data untuk pengukuran: INT64, DOUBLE, BOOL, STRING, atau DISTRIBUTION.

    Cloud Monitoring menulis satu deret waktu untuk setiap kombinasi nilai label resource dan metrik. Anda dapat menggunakan label ini untuk mengelompokkan dan memfilter deret waktu. Misalnya, saat project Google Cloud berisi beberapa instance VM Compute Engine, penggunaan CPU untuk setiap instance VM adalah deret waktu yang unik. Berikut beberapa cara untuk menampilkan data ini:

    • Anda dapat menampilkan penggunaan CPU setiap instance VM.
    • Anda dapat menampilkan penggunaan CPU untuk instance VM tertentu dengan memfilter deret waktu untuk satu nilai label instance_id.
    • Anda dapat mengelompokkan menurut instance VM berdasarkan label machine_type, lalu menampilkan penggunaan CPU rata-rata. Screenshot berikut mengilustrasikan diagram dengan konfigurasi ini:

      Pemakaian CPU rata-rata yang dikelompokkan menurut jenis mesin.

    Harga

    Secara umum, metrik sistem Cloud Monitoring gratis, dan metrik dari sistem, agen, atau aplikasi eksternal tidak gratis. Metrik yang dapat ditagih ditagih berdasarkan jumlah byte atau jumlah sampel yang diserap.

    Untuk mengetahui informasi selengkapnya tentang harga Cloud Monitoring, lihat dokumen berikut:

    Langkah selanjutnya

    • Untuk mengetahui informasi tentang cara mengonfigurasi project Google Cloud kami untuk melihat metrik untuk beberapa project Google Cloud dan akun AWS, lihat Ringkasan cakupan metrik.