Tentang deteksi anomali

Halaman ini berlaku untuk Apigee dan Apigee Hybrid.

Baca dokumentasi Apigee Edge.

Apa itu anomali?

Anomali adalah pola data API yang tidak biasa atau tidak terduga. Misalnya, lihat grafik rasio error API di bawah ini:

Grafik anomali tingkat error.

Seperti yang Anda lihat, tingkat error tiba-tiba melonjak sekitar pukul 07.00. Dibandingkan data pada waktu tersebut, peningkatan ini cukup tidak biasa untuk diklasifikasikan sebagai anomali.

Namun, tidak semua variasi dalam data API mewakili anomali: sebagian besar hanyalah fluktuasi acak. Misalnya, Anda dapat melihat beberapa variasi yang relatif kecil pada tingkat error yang mengarah ke anomali, tetapi ini tidak cukup signifikan untuk disebut sebagai anomali sebenarnya.

Anomali versus variasi data acak.

Operasi AAPI terus memantau data API dan melakukan analisis statistik untuk membedakan anomali sebenarnya dari fluktuasi acak dalam data.

Tanpa deteksi anomali, Anda harus memilih batas untuk mendeteksi sendiri setiap anomali. (Batas minimum adalah nilai yang harus dicapai oleh suatu kuantitas, seperti tingkat error, untuk memicu anomali.) Anda juga harus terus memperbarui nilai minimum, berdasarkan data terbaru. Sebaliknya, AAPI-Ops memilih nilai minimum anomali terbaik untuk Anda, berdasarkan pola data terbaru.

Saat mendeteksi anomali seperti yang ditunjukkan di atas, AAPI akan menampilkan detail anomali di dasbor Peristiwa Anomali. Pada tahap ini, Anda dapat menyelidiki anomali di dasbor API Monitoring dan mengambil tindakan yang tepat jika perlu. Anda juga dapat membuat pemberitahuan untuk memberi tahu jika peristiwa serupa terjadi pada masa mendatang.

Anomali yang terdeteksi mencakup informasi berikut:

  • Metrik yang menyebabkan anomali, seperti latensi proxy atau kode error HTTP.
  • Tingkat keparahan anomali. Tingkat keparahannya bisa sedikit, sedang, atau parah, berdasarkan tingkat keyakinannya dalam model. Tingkat keyakinan rendah menunjukkan bahwa tingkat keparahannya ringan, sedangkan tingkat keyakinan tinggi menunjukkan bahwa tingkat keparahannya parah.

Jenis anomali

Apigee otomatis mendeteksi jenis anomali berikut:

  • Peningkatan error HTTP 503 di tingkat organisasi, lingkungan, dan region
  • Peningkatan error HTTP 504 di tingkat organisasi, lingkungan, dan region
  • Peningkatan semua error HTTP 4xx atau 5xx di tingkat organisasi, lingkungan, dan region
  • Peningkatan total latensi respons untuk persentil ke-90 (p90) di tingkat organisasi, lingkungan, dan region

Cara kerja deteksi anomali

Deteksi anomali melibatkan tahap berikut:

Melatih model

Deteksi anomali bekerja dengan melatih model perilaku proxy API Anda dari data deret waktu historis. Anda tidak perlu melakukan tindakan apa pun untuk melatih model ini. Apigee secara otomatis membuat dan melatih model untuk Anda dari data API selama enam jam sebelumnya. Oleh karena itu, Apigee memerlukan data minimum enam jam pada proxy API untuk melatih model sebelum dapat mencatat anomali ke dalam log.

Tujuan pelatihan ini adalah untuk meningkatkan akurasi model, yang kemudian dapat diuji pada data historis. Cara paling sederhana untuk menguji akurasi model adalah dengan menghitung tingkat error—jumlah positif palsu dan negatif palsu, dibagi dengan jumlah total peristiwa yang diprediksi.

Mencatat peristiwa anomali ke dalam log

Saat runtime, deteksi anomali Apigee membandingkan perilaku proxy API Anda saat ini dengan perilaku yang diprediksi oleh model. Deteksi anomali kemudian dapat menentukan, dengan tingkat keyakinan tertentu, kapan metrik operasional melebihi nilai yang diprediksi. Misalnya, saat tingkat error 5xx melebihi laju yang diprediksi oleh model.

Saat mendeteksi anomali, Apigee akan otomatis mencatat peristiwa ke dalam log di dasbor Peristiwa Anomali. Daftar peristiwa yang ditampilkan di dasbor mencakup semua anomali yang terdeteksi, serta pemberitahuan yang dipicu.