Build kemampuan observasi ke dalam infrastruktur dan aplikasi Anda

Last reviewed 2023-08-21 UTC

Dokumen dalam Framework Arsitektur Google Cloud ini memberikan praktik terbaik untuk menambahkan kemampuan observasi ke dalam layanan, sehingga Anda dapat lebih memahami performa layanan dan mengidentifikasi masalah dengan cepat. Kemampuan observasi mencakup pemantauan, logging, pelacakan, profiling, proses debug, dan sistem yang serupa.

Pemantauan merupakan dasar dari hierarki keandalan layanan dalam Buku Panduan Google SRE. Tanpa pemantauan yang tepat, Anda tidak dapat mengetahui apakah aplikasi berfungsi dengan benar.

Instrumentasikan kode Anda untuk memaksimalkan kemampuan observasi

Sistem yang dirancang dengan baik bertujuan untuk memiliki jumlah kemampuan observasi yang tepat yang dimulai pada fase pengembangannya. Jangan menunggu sampai aplikasi berada dalam produksi sebelum Anda mulai mengamatinya. Lengkapi kode Anda dan pertimbangkan panduan berikut:

  • Untuk melakukan debug dan memecahkan masalah secara efisien, pikirkan entri log dan trace apa yang harus ditulis, serta metrik apa yang harus dipantau dan diekspor. Prioritaskan berdasarkan mode kegagalan yang paling mungkin atau sering terjadi dari sistem.
  • Lakukan audit secara berkala dan pangkas pemantauan Anda. Menghapus dasbor, grafik, pemberitahuan, pelacakan, dan logging yang tidak digunakan atau tidak berguna untuk menghilangkan kekacauan.

Kemampuan Observasi Google Cloud menyediakan pemantauan real-time, pemantauan dan logging multi-cloud hybrid (seperti untuk AWS dan Azure), ditambah pelacakan, pembuatan profil, dan proses debug. Google Cloud Observability juga dapat menemukan dan memantau microservice secara otomatis yang berjalan di App Engine atau di mesh layanan seperti Istio.

Jika membuat banyak data aplikasi, Anda dapat mengoptimalkan penyerapan log peristiwa analisis berskala besar dengan BigQuery. BigQuery juga cocok untuk mempertahankan dan menganalisis data deret waktu berkardinalitas tinggi dari framework pemantauan Anda. Pendekatan ini berguna karena memungkinkan Anda menjalankan kueri arbitrer dengan biaya lebih rendah daripada mencoba mendesain pemantauan dengan sempurna sejak awal, dan memisahkan pelaporan dari pemantauan. Anda dapat membuat laporan dari data menggunakan Looker Studio atau Looker.

Rekomendasi

Untuk menerapkan panduan dalam Framework Arsitektur ke lingkungan Anda sendiri, ikuti rekomendasi berikut:

  • Implementasikan pemantauan lebih awal, seperti sebelum memulai migrasi atau sebelum men-deploy aplikasi baru ke lingkungan produksi.
  • Membedakan antara masalah aplikasi dan masalah cloud yang mendasarinya. Gunakan Monitoring API, atau produk Cloud Monitoring lainnya dan Dasbor Status Google Cloud.
  • Tentukan strategi kemampuan observasi di luar pemantauan yang mencakup pelacakan, pembuatan profil, dan proses debug.
  • Bersihkan artefak kemampuan observasi yang tidak Anda digunakan atau yang tidak memberikan nilai secara rutin, seperti pemberitahuan yang tidak dapat ditindaklanjuti.
  • Jika Anda menghasilkan data kemampuan observasi dalam jumlah besar, kirim peristiwa aplikasi ke sistem data warehouse seperti BigQuery.

Langkah selanjutnya