Panoramica delle anomalie operative

Questa pagina si applica a Apigee e Apigee ibridi.

Visualizza documentazione di Apigee Edge.

Panoramica delle anomalie operative?

Le anomalie operative identificano i pattern di dati delle API insoliti o imprevisti nelle tue API, in base a pattern di dati recenti. Ad esempio: In questo grafico del tasso di errore dell'API, la percentuale di errore aumenta improvvisamente intorno alle 7:00. Confrontato ai dati precedenti a quel momento, questo aumento è abbastanza insolito da essere classificato come anomalia.

Grafico di un'anomalia del tasso di errore.

Non tutte le varianti dei dati delle API rappresentano anomalie: la maggior parte sono fluttuazioni casuali. Ad esempio, puoi notare alcune variazioni minime tasso di errore che ha portato all'anomalia, ma non sono abbastanza significativi da poter essere classificati come un'anomalia.

Anomalia e variazione di dati casuale.

Le anomalie operative monitorano continuamente i dati delle API ed esegue analisi statistiche per distinguere i veri anomalie dovute a fluttuazioni casuali nei dati.

Le anomalie operative rilevano automaticamente i seguenti tipi di anomalie:

  • Aumento degli errori HTTP 503 a livello di organizzazione, ambiente e regione
  • Aumento degli errori HTTP 504 a livello di organizzazione, ambiente e regione
  • Aumento di tutti gli errori HTTP 4xx o 5xx a livello di organizzazione, ambiente e regione
  • Aumento della latenza di risposta totale per il 90° percentile (p90) nell'organizzazione, a livello di ambiente e di regione

Un'anomalia rilevata include queste informazioni:

  • La metrica che ha causato l'anomalia, ad esempio la latenza del proxy o un codice di errore HTTP.
  • La gravità dell'anomalia. La gravità può essere lieve, moderata, o grave, in base al suo livello di confidenza nel modello. Un livello di confidenza basso indica che la gravità è lieve, mentre un livello di confidenza elevato indica che è grave.

Prerequisiti per l'utilizzo di anomalie operative

Per utilizzare le anomalie operative:

Visualizza anomalie delle operazioni rilevate

Quando le anomalie operative rilevano un'anomalia, ne vengono visualizzate i dettagli nella sezione Dashboard delle anomalie operative. Puoi esaminare l'anomalia nelle dashboard di monitoraggio delle API e prendi gli opportuni provvedimenti, se necessario. Puoi anche creano un avviso per avvisarti se si verificano eventi simili in futuro.

La dashboard Anomalie delle operazioni nella UI di Apigee è la tua fonte principale di informazioni su rilevate anomalie operative. La dashboard mostra un elenco di anomalie recenti.

Per aprire la dashboard Anomalie delle operazioni:

  1. Accedi alla UI di Apigee nella console Cloud.
  2. Passa all'organizzazione da monitorare.
  3. Nel menu a sinistra, seleziona Analytics > Anomalie delle operazioni.

Viene visualizzata la dashboard Anomalie delle operazioni.

Visualizza le anomalie nella dashboard Anomalie operative

Per impostazione predefinita, la dashboard mostra le anomalie che si sono verificate durante l'ora precedente. Se durante questo periodo di tempo non sono state rilevate anomalie, non vengono visualizzate righe visualizzato nella dashboard. Puoi selezionare un intervallo di tempo più lungo nel menu dell'intervallo di tempo in alto a destra nella dashboard.

Visualizza le anomalie nella dashboard Anomalie operative

Ogni riga della tabella corrisponde a un'anomalia rilevata, e visualizza le seguenti informazioni:

  • La data e l'ora dell'anomalia.
  • Un breve riepilogo dell'anomalia, inclusi il proxy in cui si è verificata e l'errore il codice che l'ha attivato.
  • L'ambiente in cui si è verificata l'anomalia.
  • La regione in cui si è verificata l'anomalia.
  • La gravità dell'evento anomalia: lieve, moderata o grave. La gravità è in base a una misura statistica (valore p) di quanto sarebbe improbabile che l'evento si verifichi per caso (più è improbabile, maggiore è la sua gravità).

Puoi anche esaminare un'anomalia nelle dashboard di monitoraggio delle API, che mostrano i vari grafici del traffico recente delle API e i dati di Google Cloud.

Come funziona il rilevamento di anomalie

Il rilevamento di anomalie prevede le seguenti fasi:

addestramento dei modelli

Le anomalie operative funzionano mediante l'addestramento di un modello del comportamento dei proxy API a partire da dati storici i dati delle serie temporali. Non è richiesta alcuna azione da parte tua per addestrare il modello. Apigee automaticamente crea e addestra per te modelli a partire dalle ultime sei ore di dati API. Pertanto, Apigee richiede almeno sei ore di dati su un proxy API per addestrare il modello può registrare un'anomalia.

L'obiettivo dell'addestramento è migliorare l'accuratezza del modello, che può essere testato sulla base dei dati storici. Il modo più semplice il modo per testare l'accuratezza di un modello è calcolarne il tasso di errore, ovvero somma di falsi positivi e falsi negativi divisa per il numero totale di eventi previsti.

Registra eventi anomalia

In fase di runtime, le anomalie operative confrontano il comportamento attuale dei proxy API con quello previsto dal modello. Le anomalie operative possono quindi determinare, con un livello di confidenza specifico, quando una metrica operativa supera il valore previsto. Ad esempio, se la percentuale di errori 5xx supera la tariffa prevista dal modello.

Quando Apigee rileva un'anomalia, registra automaticamente l'evento nel Anomalie delle operazioni dashboard. L'elenco di eventi visualizzati nella dashboard include tutti rilevate le anomalie e gli avvisi attivati.