Tentang deteksi anomali

Halaman ini berlaku untuk Apigee dan Apigee hybrid.

Lihat Dokumentasi Apigee Edge.

Apa itu anomali?

Anomali adalah pola data API yang tidak biasa atau tidak terduga. Misalnya, lihat grafik rasio error API di bawah ini:

Grafik anomali tingkat error.

Seperti yang Anda lihat, rasio error tiba-tiba melonjak sekitar pukul 7 pagi. Dibandingkan data yang mengarah pada saat itu, peningkatan ini tidak biasa untuk diklasifikasikan sebagai anomali.

Namun, tidak semua variasi dalam data API mewakili anomali: sebagian besar hanyalah fluktuasi acak. Misalnya, Anda dapat melihat beberapa variasi yang relatif kecil di tingkat kesalahan yang mengarah ke anomali, tetapi ini tidak cukup signifikan untuk disebut anomali.

Anomali versus variasi data acak.

Operasi AAPI terus-menerus memantau data API dan melakukan analisis statistik untuk membedakan anomali dari fluktuasi acak dalam data.

Tanpa deteksi anomali, Anda harus memilih batas untuk mendeteksi setiap anomali. (Batas adalah nilai yang harus dicapai suatu kuantitas, seperti tingkat error, untuk memicu anomali.) Anda juga harus terus memperbarui nilai minimum, berdasarkan data terbaru. Sebaliknya, AAPI-Ops memilih ambang batas anomali terbaik untuk Anda, berdasarkan pola data.

Saat AAPI mendeteksi anomali seperti yang ditampilkan di atas, AAPI akan menampilkan detail anomali di Dasbor Peristiwa Anomali. Pada tahap ini, Anda dapat menyelidiki anomali di dasbor Pemantauan API dan mengambil tindakan yang sesuai jika diperlukan. Anda juga dapat membuat pemberitahuan jika peristiwa serupa terjadi di masa mendatang.

Anomali yang terdeteksi mencakup informasi berikut:

  • Metrik yang menyebabkan anomali, seperti latensi proxy atau kode error HTTP.
  • Tingkat keparahan anomali. Tingkat keparahannya dapat kecil, sedang, atau parah, berdasarkan tingkat kepercayaannya dalam model. Tingkat kepercayaan yang rendah menunjukkan bahwa tingkat keparahannya sedikit, sementara tingkat kepercayaan yang tinggi menunjukkan bahwa itu parah.

Jenis anomali

Apigee secara otomatis mendeteksi jenis anomali berikut:

  • Meningkatnya error HTTP 503 di tingkat organisasi, lingkungan, dan region
  • Meningkatnya error HTTP 504 di tingkat organisasi, lingkungan, dan region
  • Peningkatan jumlah error HTTP 4xx atau 5xx di tingkat organisasi, lingkungan, dan region
  • Peningkatan total latensi respons untuk persentil ke-90 (p90) di organisasi, lingkungan, dan tingkat region

Cara kerja deteksi anomali

Deteksi anomali mencakup tahapan berikut:

Melatih model

Deteksi anomali berfungsi dengan melatih model perilaku proxy API Anda dari data historis data deret waktu. Anda tidak perlu melakukan tindakan apa pun untuk melatih model. Apigee secara otomatis membuat dan melatih model untuk Anda dari data API enam jam sebelumnya. Oleh karena itu, Apigee memerlukan minimum enam jam data pada proxy API untuk melatih model sebelum IDS dapat mencatat anomali.

Tujuan pelatihan ini adalah untuk meningkatkan akurasi model, yang kemudian dapat diuji berdasarkan data historis. Cara termudah cara untuk menguji akurasi model adalah dengan menghitung tingkat error-nya— jumlah positif palsu (PP) dan negatif palsu (NP), dibagi dengan jumlah total peristiwa yang diprediksi.

Catat peristiwa anomali

Saat runtime, deteksi anomali Apigee membandingkan perilaku proxy API saat ini dengan perilaku yang diprediksi oleh model. Deteksi anomali kemudian dapat menentukan, dengan tingkat kepercayaan tertentu, saat metrik operasional melebihi nilai yang diprediksi. Misalnya, saat tingkat error 5xx melebihi laju yang diprediksi oleh model.

Saat mendeteksi anomali, Apigee akan otomatis mencatat peristiwa tersebut di Peristiwa Anomali dasbor. Daftar peristiwa yang ditampilkan di dasbor mencakup semua anomali yang terdeteksi, serta peringatan yang dipicu.