Tentang deteksi anomali

Halaman ini berlaku untuk Apigee dan Apigee Hybrid.

Lihat dokumentasi Apigee Edge.

Apa itu anomali?

Anomali adalah pola data API yang tidak biasa atau tidak terduga. Misalnya, lihat grafik rasio error API di bawah:

Grafik anomali rasio error.

Seperti yang dapat Anda lihat, rasio error tiba-tiba meningkat sekitar pukul 07.00. Dibandingkan dengan data sebelum waktu tersebut, peningkatan ini cukup tidak biasa untuk diklasifikasikan sebagai anomali.

Namun, tidak semua variasi dalam data API menunjukkan anomali: sebagian besar hanyalah fluktuasi acak. Misalnya, Anda dapat melihat beberapa variasi yang relatif kecil dalam tingkat error menjelang anomali, tetapi variasi ini tidak cukup signifikan untuk disebut sebagai anomali yang sebenarnya.

Anomali versus variasi data acak.

AAPI Ops terus memantau data API dan melakukan analisis statistik untuk membedakan anomali sebenarnya dari fluktuasi acak dalam data.

Tanpa deteksi anomali, Anda harus memilih nilai minimum untuk mendeteksi setiap anomali sendiri. (Nilai minimum adalah nilai yang harus dicapai oleh suatu kuantitas, seperti rasio error, untuk memicu anomali.) Anda juga harus terus memperbarui nilai minimum, berdasarkan data terbaru. Sebaliknya, AAPI-Ops memilihkan nilai minimum anomali terbaik untuk Anda, berdasarkan pola data terbaru.

Saat mendeteksi anomali seperti yang ditunjukkan di atas, AAPI akan menampilkan detail anomali di dasbor Peristiwa Anomali. Pada tahap ini, Anda dapat menyelidiki anomali di dasbor API Monitoring dan mengambil tindakan yang sesuai jika perlu. Anda juga dapat membuat pemberitahuan untuk memberi tahu Anda jika acara serupa terjadi di masa mendatang.

Anomali yang terdeteksi mencakup informasi berikut:

  • Metrik yang menyebabkan anomali, seperti latensi proxy atau kode error HTTP.
  • Tingkat keparahan anomali. Tingkat keparahan dapat berupa ringan, sedang, atau berat, berdasarkan tingkat keyakinan model. Tingkat keyakinan yang rendah menunjukkan bahwa tingkat keparahannya ringan, sedangkan tingkat keyakinan yang tinggi menunjukkan bahwa tingkat keparahannya berat.

Jenis anomali

Apigee otomatis mendeteksi jenis anomali berikut:

  • Peningkatan error HTTP 503 di tingkat organisasi, lingkungan, dan wilayah
  • Peningkatan error HTTP 504 di tingkat organisasi, lingkungan, dan region
  • Peningkatan semua error HTTP 4xx atau 5xx di tingkat organisasi, lingkungan, dan region
  • Peningkatan latensi respons total untuk persentil ke-90 (p90) di tingkat organisasi, lingkungan, dan wilayah

Cara kerja deteksi anomali

Deteksi anomali melibatkan tahap-tahap berikut:

Melatih model

Deteksi anomali berfungsi dengan melatih model perilaku proxy API Anda dari data deret waktu historis. Anda tidak perlu melakukan tindakan apa pun untuk melatih model. Apigee secara otomatis membuat dan melatih model untuk Anda dari data API enam jam sebelumnya. Oleh karena itu, Apigee memerlukan data minimal enam jam pada proxy API untuk melatih model sebelum dapat mencatat anomali.

Tujuan pelatihan adalah untuk meningkatkan akurasi model, yang kemudian dapat diuji pada data historis. Cara paling sederhana untuk menguji akurasi model adalah dengan menghitung tingkat error-nya— jumlah positif palsu dan negatif palsu, dibagi dengan total jumlah peristiwa yang diprediksi.

Mencatat peristiwa anomali

Saat runtime, deteksi anomali Apigee membandingkan perilaku proxy API Anda saat ini dengan perilaku yang diprediksi oleh model. Deteksi anomali kemudian dapat menentukan, dengan tingkat keyakinan tertentu, kapan metrik operasional melampaui nilai yang diprediksi. Misalnya, saat tingkat error 5xx melebihi tingkat yang diprediksi oleh model.

Saat mendeteksi anomali, Apigee akan otomatis mencatat peristiwa tersebut di dasbor Peristiwa Anomali. Daftar peristiwa yang ditampilkan di dasbor mencakup semua anomali yang terdeteksi, serta pemberitahuan yang dipicu.