Panoramica delle anomalie delle operazioni

Questa pagina si applica ad Apigee e Apigee hybrid.

Visualizza la documentazione di Apigee Edge.

Panoramica di Operations Anomalies

Anomalie delle operazioni identifica pattern di dati API insoliti o imprevisti nelle tue API, in base ai pattern di dati recenti. Ad esempio, in questo grafico del tasso di errore dell'API, il tasso di errore aumenta improvvisamente intorno alle 7:00. Rispetto ai dati precedenti, questo aumento è abbastanza insolito da essere classificato come anomalia.

Grafico di un'anomalia del tasso di errore.

Non tutte le variazioni nei dati API rappresentano anomalie: la maggior parte sono fluttuazioni casuali. Ad esempio, puoi notare alcune piccole variazioni nel tasso di errore che precedono l'anomalia, ma queste non sono abbastanza significative da essere classificate come anomalia.

Anomalia rispetto alla variazione casuale dei dati.

Anomalie operative monitora continuamente i dati delle API ed esegue analisi statistiche per distinguere le anomalie reali dalle fluttuazioni casuali nei dati.

Anomalie delle operazioni rileva automaticamente questi tipi di anomalie:

  • Aumento degli errori HTTP 503 a livello di organizzazione, ambiente e regione
  • Aumento degli errori HTTP 504 a livello di organizzazione, ambiente e regione
  • Aumento di tutti gli errori HTTP 4xx o 5xx a livello di organizzazione, ambiente e regione
  • Aumento della latenza di risposta totale per il 90° percentile (p90) a livello di organizzazione, ambiente e regione

Un'anomalia rilevata include queste informazioni:

  • La metrica che ha causato l'anomalia, ad esempio la latenza del proxy o un codice di errore HTTP.
  • La gravità dell'anomalia. La gravità può essere lieve, moderata o grave, in base al livello di attendibilità del modello. Un livello di confidenza basso indica che la gravità è lieve, mentre un livello di confidenza alto indica che è grave.

Prerequisiti per l'utilizzo di Anomalie delle operazioni

Per utilizzare Anomalie delle operazioni:

Visualizzare le anomalie delle operazioni rilevate

Quando Anomalie delle operazioni rileva un'anomalia, ne mostra i dettagli nella dashboard Anomalie delle operazioni. Puoi esaminare l'anomalia nelle dashboard di API Monitoring e intraprendere le azioni appropriate, se necessario. Puoi anche creare un avviso per ricevere una notifica se si verificano eventi simili in futuro.

La dashboard Anomalie delle operazioni nell'interfaccia utente Apigee è la tua fonte principale di informazioni sulle anomalie delle operazioni rilevate. La dashboard mostra un elenco di anomalie recenti.

Per aprire la dashboard Anomalie delle operazioni:

  1. Accedi alla UI Apigee nella console Google Cloud.
  2. Passa all'organizzazione che vuoi monitorare.
  3. Nel menu a sinistra, seleziona Analytics > Anomali operative.

Viene visualizzata la dashboard Anomalie delle operazioni.

Visualizzare le anomalie nella dashboard Anomalie delle operazioni

Per impostazione predefinita, la dashboard mostra le anomalie che si sono verificate nell'ora precedente. Se non sono state rilevate anomalie durante questo periodo di tempo, nella dashboard non vengono visualizzate righe. Puoi selezionare un intervallo di tempo più ampio dal menu dell'intervallo di tempo in alto a destra nella dashboard.

Visualizzare le anomalie nella dashboard Anomalie delle operazioni

Ogni riga della tabella corrisponde a un'anomalia rilevata e mostra le seguenti informazioni:

  • La data e l'ora dell'anomalia.
  • Un breve riepilogo dell'anomalia, incluso il proxy in cui si è verificata e il codice di errore che l'ha attivata.
  • L'ambiente in cui si è verificata l'anomalia.
  • La regione in cui si è verificata l'anomalia.
  • La gravità dell'evento anomalo: lieve, moderata o grave. La gravità si basa su una misura statistica (valore p) della probabilità che l'evento si verifichi per caso (più è improbabile l'evento, maggiore è la sua gravità).

Puoi anche analizzare un'anomalia nelle dashboard di API Monitoring, che mostrano vari grafici dei dati recenti sul traffico API.

Come funziona il rilevamento di anomalie

Il rilevamento delle anomalie prevede le seguenti fasi:

addestramento dei modelli

Anomalie delle operazioni funziona addestrando un modello del comportamento dei proxy API a partire da dati storici delle serie temporali. Non è richiesto alcun intervento da parte tua per addestrare il modello. Apigee crea e addestra automaticamente i modelli per te a partire dalle sei ore precedenti di dati API. Pertanto, Apigee richiede un minimo di sei ore di dati su un proxy API per addestrare il modello prima che possa registrare un'anomalia.

L'obiettivo dell'addestramento è migliorare l'accuratezza del modello, che può poi essere testato sui dati storici. Il modo più semplice per testare l'accuratezza di un modello è calcolare il suo tasso di errore, ovvero la somma di falsi positivi e falsi negativi, divisa per il numero totale di eventi previsti.

Eventi anomali dei log

In fase di runtime, Operations Anomalies confronta il comportamento attuale dei proxy API con il comportamento previsto dal modello. Anomalie operative può quindi determinare, con un livello di confidenza specifico, quando una metrica operativa supera il valore previsto. Ad esempio, quando il tasso di errori 5xx supera il tasso previsto dal modello.

Quando Apigee rileva un'anomalia, registra automaticamente l'evento nella dashboard Anomalie delle operazioni. L'elenco degli eventi visualizzati nella dashboard include tutte le anomalie rilevate, nonché gli avvisi attivati.