Questa pagina si applica ad Apigee e Apigee hybrid.
Visualizza documentazione di Apigee Edge.
Che cos'è un'anomalia?
Un'anomalia è un pattern dei dati API insolito o imprevisto. Ad esempio: dai un'occhiata al grafico del tasso di errore dell'API riportato di seguito:
Come puoi vedere, il tasso di errore aumenta improvvisamente intorno alle 7:00. Rispetto ai dati precedenti a questo orario, questo aumento è sufficientemente insolito da essere classificato come un'anomalia.
Tuttavia, non tutte le varianti dei dati delle API rappresentano anomalie: la maggior parte sono semplicemente fluttuazioni casuali. Ad esempio, puoi notare alcune variazioni relativamente minori della tasso di errore che ha portato all'anomalia, ma non sono abbastanza significativi da essere un'anomalia.
Le operazioni AAPI monitorano continuamente i dati delle API ed esegue analisi statistiche per distinguere i veri anomalie dovute a fluttuazioni casuali nei dati.
Senza il rilevamento delle anomalie, devi scegliere una soglia per rilevare autonomamente ogni anomalia. Una soglia è un valore che una quantità, ad esempio la percentuale di errore, deve raggiungere per attivare un'anomalia. Devi anche mantenere aggiornati i valori delle soglie in base ai dati più recenti. Al contrario, AAPI-Ops sceglie le soglie di anomalia migliori per te, in base alle recenti pattern di dati.
Quando l'AAPI rileva un'anomalia come quella mostrata sopra, ne mostra i dettagli nella dashboard Anomaly Events. A questo punto, puoi esaminare l'anomalia nelle dashboard di monitoraggio dell'API e, se necessario, intraprendere le azioni appropriate. Puoi anche creano un avviso per avvisarti se si verificano eventi simili in futuro.
Un'anomalia rilevata include le seguenti informazioni:
- La metrica che ha causato l'anomalia, ad esempio la latenza del proxy o un codice di errore HTTP.
- La gravità dell'anomalia. La gravità può essere lieve, moderata, o grave, in base al suo livello di confidenza nel modello. Un livello di confidenza basso indica che la gravità è lieve, mentre un livello di confidenza elevato indica che è grave.
Tipi di anomalie
Apigee rileva automaticamente i seguenti tipi di anomalie:
- Aumento degli errori HTTP 503 a livello di organizzazione, ambiente e regione
- Aumento degli errori HTTP 504 a livello di organizzazione, ambiente e regione
- Aumento di tutti gli errori HTTP 4xx o 5xx a livello di organizzazione, ambiente e regione
- Aumento della latenza di risposta totale per il 90° percentile (p90) a livello di organizzazione, ambiente e regione
Come funziona il rilevamento di anomalie
Il rilevamento di anomalie prevede le seguenti fasi:
addestramento dei modelli
Il rilevamento di anomalie funziona addestrando un modello del comportamento dei proxy API partendo da dati storici i dati delle serie temporali. Non è richiesta alcuna azione da parte tua per addestrare il modello. Apigee automaticamente crea e addestra per te modelli a partire dalle ultime sei ore di dati API. Pertanto, Apigee richiede un minimo di sei ore di dati su un proxy API per addestrare il modello prima di poter registrare un'anomalia.
L'obiettivo dell'addestramento è migliorare l'accuratezza del modello, che può essere testato sulla base dei dati storici. Il modo più semplice il modo per testare l'accuratezza di un modello è calcolarne il tasso di errore, ovvero somma di falsi positivi e falsi negativi divisa per il numero totale di eventi previsti.
Registra gli eventi di anomalia
In fase di runtime, il rilevamento di anomalie di Apigee confronta il comportamento attuale dei proxy API con il comportamento previsto dal modello. Il rilevamento di anomalie può quindi determinare, con un livello di confidenza specifico, quando una metrica operativa supera il valore previsto. Ad esempio, se la percentuale di errori 5xx supera la tariffa prevista dal modello.
Quando Apigee rileva un'anomalia, registra automaticamente l'evento nella dashboard Eventi anomali. L'elenco di eventi visualizzati nella dashboard include tutti rilevate le anomalie e gli avvisi attivati.