Ringkasan Cloud Monitoring

Dokumen ini berisi ringkasan layanan yang disediakan Cloud Monitoring. Layanan ini dapat membantu Anda memahami perilaku, kondisi, dan performa aplikasi Anda serta layanan Google Cloud lainnya. Cloud Monitoring secara otomatis mengumpulkan dan menyimpan informasi performa untuk sebagian besar layanan Google Cloud. Anda dapat mengumpulkan metrik Prometheus menggunakan Google Cloud Managed Service for Prometheus. Jika Anda menginstal Agen Operasional pada virtual machine (VM) Compute Engine, Anda dapat mengumpulkan metrik dan log dari aplikasi Anda dan dari aplikasi pihak ketiga.

Layanan pemberitahuan, pengujian, dan visualisasi yang disediakan oleh Cloud Monitoring membantu Anda menjawab pertanyaan penting seperti berikut:

Berapa beban pada layanan saya?
Apakah situs saya merespons dengan benar?
Apakah layanan saya berperforma baik?

Cloud Monitoring menyediakan dukungan Google Cloud Console dan API untuk sebagian besar layanannya. Beberapa layanan juga mendukung Google Cloud CLI atau Terraform. Halaman referensi Cloud Monitoring API, seperti halaman alertPolicies.list, memungkinkan Anda bereksperimen dengan panggilan API langsung dari halaman referensi.

Layanan Cloud Monitoring

Cloud Monitoring menyediakan berbagai layanan yang dapat Anda gunakan untuk memahami kondisi dan performa aplikasi Anda, serta layanan Google Cloud lain yang Anda gunakan.

Notifikasi dan pemberitahuan

Agar diberi tahu saat nilai metrik performa memenuhi kriteria yang Anda tentukan, buat kebijakan pemberitahuan. Kebijakan pemberitahuan mencakup daftar orang atau grup yang akan menerima notifikasi. Monitoring mendukung saluran notifikasi umum, termasuk email, Cloud Mobile App, dan layanan seperti PagerDuty atau Slack. Misalnya, Anda dapat membuat kebijakan pemberitahuan sehingga Anda akan menerima notifikasi saat pemakaian CPU VM melebihi 80%.

Setiap notifikasi menyertakan informasi yang relevan tentang kegagalan, dan menyertakan link ke insiden. Insiden adalah data persisten yang menyimpan informasi yang dapat Anda gunakan untuk memecahkan masalah kegagalan. Biasanya, data mencantumkan status insiden, link ke log, diagram data metrik yang direkam, label, dan durasi.

Layanan pemberitahuan terintegrasi dengan banyak layanan Google Cloud. Jika integrasi tersebut ada, Anda mungkin melihat panel yang mencantumkan pemberitahuan yang direkomendasikan, atau Anda mungkin melihat tombol pada diagram yang memungkinkan Anda membuat kebijakan pemberitahuan. Pada kedua kasus tersebut, kebijakan pemberitahuan sudah dikonfigurasi sebelumnya. Anda hanya menentukan daftar orang atau grup yang akan menerima notifikasi.

Anda dapat membuat dan mengelola kebijakan pemberitahuan menggunakan Konsol Google Cloud, Cloud Monitoring API, Google Cloud CLI, atau Terraform.

Pemantauan dan validasi proaktif

Untuk menguji ketersediaan, konsistensi, dan performa layanan, aplikasi, halaman web, dan API, buat monitor sintetis. Misalnya, Anda dapat memeriksa endpoint HTTP, HTTPS, dan TCP untuk mengetahui apakah ada responsivitas dengan cek uptime, lalu akan menerima notifikasi saat endpoint gagal merespons. Anda juga dapat membuat pemeriksa link rusak untuk meng-crawl halaman web, lalu memberi tahu Anda saat link yang rusak terdeteksi.

Anda dapat membuat dan mengelola monitor sintetis menggunakan Konsol Google Cloud, Cloud Monitoring API, Google Cloud CLI, atau Terraform.

Visualisasi data

Untuk memvisualisasikan data guna melihat tren, mengidentifikasi pencilan, dan melihat detail lainnya tentang data, Anda dapat menggunakan layanan dasbor dan diagram:

Layanan dasbor secara otomatis membuat dasbor yang dikelola Google Cloud saat Anda menambahkan resource ke project Google Cloud. Misalnya, dasbor dibuat saat Anda membuat instance Compute Engine, kebijakan pemberitahuan, atau monitor sintetis. Anda dapat menggunakan dasbor ini untuk melihat performa dan informasi konfigurasi, seperti penggunaan disk atau alamat IP, dan untuk melihat peristiwa.

Untuk mengontrol data yang Anda lihat dan format tampilan untuk data tersebut, buat dasbor kustom. Misalnya, Anda dapat mengimpor dasbor Grafana atau menginstal dasbor dari template. Dasbor kustom Anda dapat menampilkan diagram, tabel, log dan grup error, kebijakan dan insiden pemberitahuan, serta teks. Anda juga dapat membagikan dasbor kustom kepada orang atau grup di organisasi Anda, dan mengonfigurasi dasbor ini untuk menampilkan peristiwa.

Anda dapat membuat dan mengelola dasbor menggunakan Google Cloud Console atau API.
Layanan diagram, Metrics Explorer, memungkinkan Anda memvisualisasikan dan mempelajari data deret waktu dengan cepat. Setelan diagram memungkinkan Anda membandingkan data saat ini dengan data sebelumnya, menampilkan pencilan dan persentil, serta menampilkan beberapa metrik. Anda juga dapat menyimpan diagram ke dasbor kustom.

Pengumpulan dan penyimpanan data

Cloud Monitoring mengumpulkan dan menyimpan jenis data metrik berikut:

Metrik sistem yang dihasilkan oleh layanan Google Cloud. Metrik ini memberikan informasi tentang cara layanan beroperasi.

Metrik sistem dan aplikasi yang dikumpulkan Agen Operasional terkait resource sistem dan aplikasi yang berjalan di instance Compute Engine. Anda dapat mengonfigurasi Agen Operasional untuk mengumpulkan metrik dari plugin pihak ketiga seperti server web Apache atau Nginx, atau database MongoDB atau PostgreSQL.

Metrik yang ditentukan pengguna yang dibuat menggunakan Cloud Monitoring API atau menggunakan library seperti OpenTelemetry.
[Metrik eksternal][metrics-external] yang ditentukan oleh beberapa library open source atau penyedia pihak ketiga.
Metrik Prometheus yang dikumpulkan oleh Google Cloud Managed Service for Prometheus, atau dengan menggunakan Agen Operasional dan penerima Prometheus atau penerima OLTP.

Metrik berbasis log yang mencatat informasi numerik tentang log yang ditulis ke Cloud Logging. Metrik berbasis log yang ditentukan Google mencakup jumlah error yang terdeteksi oleh layanan Anda dan jumlah total entri log yang diterima oleh project Google Cloud Anda. Anda juga dapat menentukan metrik berbasis log.

Bahasa kueri

Saat membuat kebijakan atau diagram pemberitahuan, Anda harus memberikan kueri yang menjelaskan data atau diagram yang ingin dipantau:

Konsol Google Cloud: Anda dapat membuat kueri dengan membuat pilihan dari menu, atau menulis kueri. Editor kueri tersedia untuk Bahasa Kueri Prometheus (PromQL) dan Bahasa Kueri Monitoring (MQL). Editor kueri menyediakan pemeriksaan sintaksis dan saran. Anda juga dapat menulis ekspresi Monitoring filter.
Cloud Monitoring API: API ini mendukung Bahasa Kueri Prometheus (PromQL), kueri MQL, dan ekspresi filter Monitoring.

Memantau sistem yang besar

Bagian ini menjelaskan cara mengelola resource sebagai koleksi dan cara memantau metrik yang disimpan dalam beberapa project Google Cloud.

Mengelola resource sebagai koleksi

Untuk mengelola resource sebagai koleksi, bukan satu per satu, buat grup resource. Grup resource adalah kumpulan resource dinamis yang memenuhi beberapa kriteria yang Anda berikan. Saat Anda menambahkan dan menghapus resource, misalnya dengan menambahkan instance VM Compute Engine ke project Google Cloud, keanggotaan dalam grup akan otomatis berubah. Berikut adalah contoh grup resource:

Instance Compute Engine yang namanya diawali dengan string prod-.
Resource dengan tag test-cluster.
Instance Amazon EC2 di region A atau region B.

Setelah menentukan grup resource, Anda dapat memantau grup seolah-olah grup tersebut merupakan resource tunggal. Misalnya, Anda dapat mengonfigurasi cek uptime untuk memantau grup resource. Untuk diagram dan kebijakan pemberitahuan, Anda juga dapat memfilter berdasarkan nama grup.

Untuk mengetahui informasi selengkapnya, lihat Mengonfigurasi grup resource.

Memantau metrik untuk beberapa project Google Cloud

Untuk melihat dan memantau data deret waktu untuk beberapa project Google Cloud dan akun AWS melalui satu antarmuka, konfigurasikan cakupan metrik multi-project.

Secara default, halaman Cloud Monitoring di Konsol Google Cloud hanya memberikan akses ke deret waktu yang disimpan di project pencakupan. Project pencakupan adalah project yang Anda pilih dengan pemilih project Google Cloud Console. Project pencakupan menyimpan pemberitahuan, monitor sintetis, dasbor, dan grup pemantauan yang Anda konfigurasi.

Project pencakupan juga menghosting cakupan metrik. Cakupan metrik menentukan project dan akun yang metriknya terlihat oleh project pencakupan. Anda dapat mengonfigurasi cakupan metrik untuk menyertakan data deret waktu dari project Google Cloud lainnya dan dari akun AWS. Untuk informasi cara mengubah cakupan metrik, lihat Mengonfigurasi cakupan metrik untuk beberapa project.

Model data Cloud Monitoring

Bagian ini memperkenalkan model data Cloud Monitoring:

Jenis metrik menjelaskan sesuatu yang diukur. Contoh jenis metrik mencakup pemakaian CPU VM dan persentase disk yang digunakan.
Deret waktu adalah struktur data yang berisi pengukuran berstempel waktu terhadap suatu metrik serta informasi tentang sumber dan arti pengukuran tersebut.

Berikut ini beberapa detail tentang apa saja yang terdapat dalam deret waktu:

Array points berisi pengukuran yang diberi stempel waktu.

Berikut adalah contoh array points dengan dua nilai:

  "points": [
    {
      "interval": {
        "startTime": "2020-07-27T20:20:21.597143Z",
        "endTime": "2020-07-27T20:20:21.597143Z"
      },
      "value": {
        "doubleValue": 0.473005
      }
    },
    {
      "interval": {
        "startTime": "2020-07-27T20:19:21.597239Z",
        "endTime": "2020-07-27T20:19:21.597239Z"
      },
      "value": {
        "doubleValue": 0.473025
      }
    },
  ],

Untuk memahami arti nilai, Anda perlu merujuk ke data lain yang disertakan dalam deret waktu dan definisi data tersebut.

Kolom resource menjelaskan komponen hardware atau software yang dipantau. Dalam Cloud Monitoring, komponen hardware atau software disebut sebagai resource yang dimonitor. Contoh resource yang dipantau meliputi instance Compute Engine dan aplikasi App Engine. Untuk daftar resource yang dimonitor, lihat Daftar resource yang dimonitor.

Berikut adalah contoh kolom resource:
```
  "resource": {
    "type": "gce_instance",
    "labels": {
      "instance_id": "2708613220420473591",
      "zone": "us-east1-b",
      "project_id": "sampleproject"
    }
  }
```
- Kolom type mencantumkan resource yang dimonitor sebagai gce_instance, yang menunjukkan bahwa pengukuran ini dilakukan pada instance VM Compute Engine.
- Kolom labels berisi key-value pair yang memberikan informasi tambahan tentang resource yang dimonitor. Untuk jenis gce_instance, label mengidentifikasi instance VM yang dipantau.
Kolom metric menjelaskan apa yang sedang diukur.

Berikut adalah contoh kolom metric:
```
  "metric": {
    "labels": {
      "instance_name": "test"
    },
    "type": "compute.googleapis.com/instance/cpu/utilization"
  },
```
- Untuk layanan Google, kolom type menentukan layanan dan apa yang dimonitor. Dalam contoh ini, layanan Compute Engine yang mengukur pemakaian CPU. Jika kolom type diawali dengan custom atau external, metrik tersebut adalah metrik kustom atau metrik yang ditentukan oleh pihak ketiga.
- Kolom labels berisi key-value pair yang memberikan informasi tambahan tentang pengukuran. Label ini ditentukan sebagai bagian dari MetricDescriptor, yang merupakan struktur data yang menentukan atribut data yang diukur. MetricDescriptor untuk metrik compute.googleapis.com/instance/cpu/utilization menyertakan label instance_name.
Kolom metricKind menjelaskan hubungan antara pengukuran yang berdekatan dalam deret waktu:
- Metrik GAUGE menyimpan nilai benda yang diukur pada waktu tertentu—misalnya, catatan suhu per jam.
- Metrik CUMULATIVE menyimpan nilai akumulasi benda yang diukur pada waktu tertentu, misalnya odometer di kendaraan.
- Metrik DELTA menyimpan perubahan nilai item yang diukur selama periode tertentu—misalnya, ringkasan stok yang menunjukkan keuntungan atau kerugian stok.
Kolom valueType menjelaskan jenis data untuk pengukuran: INT64, DOUBLE, BOOL, STRING, atau DISTRIBUTION.

Cloud Monitoring menulis satu deret waktu untuk setiap kombinasi nilai label resource dan metrik. Anda dapat menggunakan label ini untuk mengelompokkan dan memfilter deret waktu. Misalnya, jika project Google Cloud berisi beberapa instance VM Compute Engine, pemakaian CPU untuk setiap instance VM merupakan deret waktu yang unik. Berikut adalah beberapa cara untuk menampilkan data ini:

Anda dapat menampilkan pemakaian CPU setiap instance VM.
Anda dapat menunjukkan pemakaian CPU untuk instance VM tertentu dengan memfilter deret waktu untuk satu nilai label instance_id.
Anda dapat mengelompokkan berdasarkan instance VM menurut label machine_type, lalu menampilkan pemakaian CPU rata-rata. Screenshot berikut mengilustrasikan diagram dengan konfigurasi ini:

Harga

Secara umum, metrik sistem Cloud Monitoring gratis, sedangkan metrik dari sistem, agen, atau aplikasi eksternal tidak. Metrik yang dapat ditagih ditagih berdasarkan jumlah byte atau jumlah sampel yang diserap.

Untuk mengetahui informasi selengkapnya tentang harga Cloud Monitoring, lihat dokumen berikut:

Langkah selanjutnya

Untuk mempelajari Cloud Monitoring, coba Panduan memulai untuk memantau instance Compute Engine.

Untuk mendapatkan informasi tentang cara mengonfigurasi project Google Cloud guna melihat metrik beberapa project Google Cloud dan akun AWS, lihat Ringkasan cakupan metrik.

Untuk informasi tentang model data Cloud Monitoring, lihat Metrik, deret waktu, dan resource.
Untuk mengetahui informasi tentang Cloud Monitoring API, lihat API dan referensi.
Untuk daftar metrik dan resource yang dipantau, lihat Daftar metrik dan Daftar resource yang dimonitor.
Kuota dan batas.