Tentang deteksi anomali

Halaman ini berlaku untuk Apigee dan Apigee hybrid.

Lihat dokumentasi Apigee Edge.

Apa yang dimaksud dengan anomali?

Anomali adalah pola data API yang tidak biasa atau tidak terduga. Misalnya, lihat grafik rasio error API di bawah:

Grafik anomali rasio error.

Seperti yang dapat Anda lihat, rasio error tiba-tiba melonjak sekitar pukul 07.00. Dibandingkan dengan data yang terjadi hingga waktu tersebut, peningkatan ini cukup tidak biasa untuk diklasifikasikan sebagai anomali.

Namun, tidak semua variasi dalam data API menunjukkan anomali: sebagian besar hanya merupakan fluktuasi acak. Misalnya, Anda dapat melihat beberapa variasi yang relatif kecil dalam rasio error yang menyebabkan anomali, tetapi hal ini tidak cukup signifikan untuk disebut sebagai anomali yang sebenarnya.

Anomali versus variasi data acak.

AAPI Ops terus memantau data API dan melakukan analisis statistik untuk membedakan anomali yang sebenarnya dari fluktuasi acak dalam data.

Tanpa deteksi anomali, Anda harus memilih nilai minimum untuk mendeteksi setiap anomali sendiri. (Nilai minimum adalah nilai yang harus dicapai kuantitas, seperti rasio error, untuk memicu anomali.) Anda juga harus terus memperbarui nilai nilai minimum, berdasarkan data terbaru. Sebaliknya, AAPI-Ops memilih nilai minimum anomali terbaik untuk Anda, berdasarkan pola data terbaru.

Saat mendeteksi anomali seperti yang ditampilkan di atas, AAPI akan menampilkan detail anomali di dasbor Peristiwa Anomali. Pada tahap ini, Anda dapat menyelidiki anomali di dasbor Monitoring API dan mengambil tindakan yang sesuai jika diperlukan. Anda juga dapat membuat pemberitahuan untuk memberi tahu Anda jika peristiwa serupa terjadi di masa mendatang.

Anomali yang terdeteksi mencakup informasi berikut:

  • Metrik yang menyebabkan anomali, seperti latensi proxy atau kode error HTTP.
  • Tingkat keparahan anomali. Tingkat keparahannya dapat berupa ringan, sedang, atau berat, berdasarkan tingkat keyakinannya dalam model. Tingkat keyakinan yang rendah menunjukkan bahwa tingkat keparahannya sedikit, sedangkan tingkat keyakinan yang tinggi menunjukkan bahwa tingkat keparahannya parah.

Jenis anomali

Apigee secara otomatis mendeteksi jenis anomali berikut:

  • Peningkatan error HTTP 503 di tingkat organisasi, lingkungan, dan wilayah
  • Peningkatan error HTTP 504 di tingkat organisasi, lingkungan, dan region
  • Peningkatan semua error HTTP 4xx atau 5xx di tingkat organisasi, lingkungan, dan region
  • Peningkatan latensi respons total untuk persentil ke-90 (p90) di tingkat organisasi, lingkungan, dan wilayah

Cara kerja deteksi anomali

Deteksi anomali melibatkan tahap-tahap berikut:

Melatih model

Deteksi anomali berfungsi dengan melatih model perilaku proxy API Anda dari data deret waktu historis. Anda tidak perlu melakukan tindakan apa pun untuk melatih model. Apigee secara otomatis membuat dan melatih model untuk Anda dari data API enam jam sebelumnya. Oleh karena itu, Apigee memerlukan data minimal enam jam di proxy API untuk melatih model sebelum dapat mencatat anomali ke dalam log.

Tujuan pelatihan adalah untuk meningkatkan akurasi model, yang kemudian dapat diuji pada data historis. Cara paling sederhana untuk menguji akurasi model adalah dengan menghitung rasio error-nya—jumlah positif palsu dan negatif palsu, dibagi dengan jumlah total peristiwa yang diprediksi.

Mencatat peristiwa anomali ke dalam log

Saat runtime, deteksi anomali Apigee membandingkan perilaku proxy API Anda saat ini dengan perilaku yang diprediksi oleh model. Deteksi anomali kemudian dapat menentukan, dengan tingkat keyakinan tertentu, saat metrik operasional melebihi nilai yang diprediksi. Misalnya, saat rasio error 5xx melebihi rasio yang diprediksi oleh model.

Saat mendeteksi anomali, Apigee akan otomatis mencatat peristiwa tersebut ke dalam log di dasbor Peristiwa Anomali. Daftar peristiwa yang ditampilkan di dasbor mencakup semua anomali yang terdeteksi, serta pemberitahuan yang dipicu.