Panoramica delle anomalie delle operazioni

Questa pagina si applica ad Apigee e Apigee hybrid.

Visualizza documentazione di Apigee Edge.

Panoramica delle anomalie operative?

Le anomalie operative identificano i pattern di dati delle API insoliti o imprevisti nelle tue API, in base a pattern di dati recenti. Ad esempio, in questo grafico della percentuale di errore dell'API, la percentuale di errore aumenta improvvisamente intorno alle 7:00. Confrontato con i dati precedenti a quel momento, questo aumento è sufficientemente insolito da essere classificato come un'anomalia.

Grafico di un'anomalia del tasso di errore.

Non tutte le varianti dei dati delle API rappresentano anomalie: la maggior parte sono fluttuazioni casuali. Ad esempio, potresti notare alcune piccole variazioni nel tasso di errore che precedono l'anomalia, ma queste non sono sufficientemente significative da essere classificate come anomalia.

Anomalia e variazione di dati casuale.

Anomalie operative monitora continuamente i dati dell'API ed esegue analisi statistiche per distinguere le vere anomalie dalle fluttuazioni casuali nei dati.

Le anomalie operative rilevano automaticamente i seguenti tipi di anomalie:

  • Aumento degli errori HTTP 503 a livello di organizzazione, ambiente e regione
  • Aumento degli errori HTTP 504 a livello di organizzazione, ambiente e regione
  • Aumento di tutti gli errori HTTP 4xx o 5xx a livello di organizzazione, ambiente e regione
  • Aumento della latenza di risposta totale per il 90° percentile (p90) nell'organizzazione, a livello di ambiente e di regione

Un'anomalia rilevata include queste informazioni:

  • La metrica che ha causato l'anomalia, ad esempio la latenza del proxy o un codice di errore HTTP.
  • La gravità dell'anomalia. La gravità può essere lieve, moderata, o grave, in base al suo livello di confidenza nel modello. Un livello di confidenza basso indica che la gravità è lieve, mentre un livello di confidenza elevato indica che è grave.

Prerequisiti per l'utilizzo di anomalie operative

Per utilizzare le anomalie delle operazioni:

Visualizza anomalie delle operazioni rilevate

Quando Anomalie delle operazioni rileva un'anomalia, ne mostra i dettagli nella dashboard Anomalie delle operazioni. Puoi esaminare l'anomalia nelle dashboard di monitoraggio delle API e, se necessario, adottare gli opportuni provvedimenti. Puoi anche creano un avviso per avvisarti se si verificano eventi simili in futuro.

La dashboard Anomalie delle operazioni nella UI di Apigee è la tua fonte principale di informazioni su rilevate anomalie operative. La dashboard mostra un elenco di anomalie recenti.

Per aprire la dashboard Anomalie delle operazioni:

  1. Accedi alla UI di Apigee nella console Cloud.
  2. Passa all'organizzazione da monitorare.
  3. Nel menu a sinistra, seleziona Analytics > Anomalie operazioni.

Viene visualizzata la dashboard Anomalie delle operazioni.

Visualizza le anomalie nella dashboard Anomalie operative

Per impostazione predefinita, la dashboard mostra le anomalie che si sono verificate durante l'ora precedente. Se durante questo periodo di tempo non sono state rilevate anomalie, non vengono visualizzate righe visualizzato nella dashboard. Puoi selezionare un intervallo di tempo più lungo nel menu dell'intervallo di tempo in alto a destra nella dashboard.

Visualizzare le anomalie nella dashboard Anomalie delle operazioni

Ogni riga della tabella corrisponde a un'anomalia rilevata e mostra le seguenti informazioni:

  • La data e l'ora dell'anomalia.
  • Un breve riepilogo dell'anomalia, incluso il proxy in cui si è verificata e il codice di errore che l'ha attivata.
  • L'ambiente in cui si è verificata l'anomalia.
  • La regione in cui si è verificata l'anomalia.
  • La gravità dell'evento anomalo: lieve, moderata o grave. La gravità è in base a una misura statistica (valore p) di quanto improbabile sarebbe per il che l'evento si verifichi per caso (più è improbabile che sia, maggiore è la sua gravità).

Puoi anche esaminare un'anomalia nelle dashboard di monitoraggio delle API, che mostrano i vari grafici del traffico recente delle API e i dati di Google Cloud.

Come funziona il rilevamento di anomalie

Il rilevamento delle anomalie prevede le seguenti fasi:

addestramento dei modelli

Anomalie di operazioni funziona addestrando un modello del comportamento dei proxy API a partire da dati storici su serie temporali. Non è richiesta alcuna azione da parte tua per addestrare il modello. Apigee automaticamente crea e addestra per te modelli a partire dalle ultime sei ore di dati API. Pertanto, Apigee richiede un minimo di sei ore di dati su un proxy API per addestrare il modello prima di poter registrare un'anomalia.

L'obiettivo dell'addestramento è migliorare l'accuratezza del modello, che può essere testato sulla base dei dati storici. Il modo più semplice il modo per testare l'accuratezza di un modello è calcolarne il tasso di errore, ovvero somma di falsi positivi e falsi negativi divisa per il numero totale di eventi previsti.

Registra gli eventi di anomalia

In fase di runtime, le anomalie operative confrontano il comportamento attuale dei proxy API con quello previsto dal modello. Le anomalie operative possono quindi determinare, con un livello di confidenza specifico, quando una metrica operativa supera il valore previsto. Ad esempio, se la percentuale di errori 5xx supera la tariffa prevista dal modello.

Quando Apigee rileva un'anomalia, registra automaticamente l'evento nella dashboard Anomalie operazioni. L'elenco di eventi visualizzato nella dashboard include tutte le anomalie rilevate, nonché gli avvisi attivati.