Flow Analyzer analizza i dati dei log di flusso VPC archiviati in un formato record. I record dei log contengono campi di base, che sono i campi principali di ogni record del log, e campi di metadati, che forniscono ulteriori informazioni. I record dei log per il monitoraggio dei flussi di traffico sono costituiti da tre componenti principali:
- Informazioni sulle risorse
- Tipi di metriche
- Serie temporale
Informazioni sulle risorse
I record dei log includono i seguenti dati sulle risorse:
- Dettagli della connessione
- Dati dei segnalatori
- Dettagli di GKE
- Dettagli istanza
- Dettagli geografici
- Dettagli della VPC
Tipi di metriche
I record dei log includono i dati per i seguenti tipi di metriche:
- Byte inviati: contiene informazioni sui volumi del payload e non include le intestazioni. Questo valore della metrica può essere zero perché alcuni pacchetti contengono solo intestazioni e non includono payload.
- Pacchetti inviati:indica il numero di pacchetti inviati dall'origine alla destinazione.
Dati non elaborati delle serie temporali
La quantità di dati metrici non elaborati in una singola serie temporale può essere enorme e solitamente esistono molte serie temporali associate a un tipo di metrica. Per analizzare l'intero insieme di dati alla ricerca di elementi comuni, tendenze o outlier, è necessario eseguire un po' di elaborazione sulle serie temporali nell'insieme. In caso contrario, ci sono troppi dati da considerare.
Per introdurre il campionamento e l'aggregazione degli esempi in questa pagina, utilizza un numero ridotto di serie temporali ipotetiche. Ad esempio, il seguente diagramma mostra alcuni minuti di dati non elaborati per il tipo di metrica byte per secondo:
I dati non elaborati delle serie temporali devono essere manipolati prima di poter essere analizzati e spesso l'analisi prevede il campionamento dei dati e l'aggregazione di alcuni. In questa pagina vengono descritte due tecniche principali per perfezionare i dati non elaborati:
- Campionamento, che rimuove alcuni dati dalla considerazione. Google Cloud esegue il campionamento e utilizza i dati richiesti dai record di log per eseguire le operazioni indicate nelle query.
- Aggregazione, che combina più elementi di dati in un insieme più piccolo in base alle dimensioni specificate.
Il campionamento e l'aggregazione sono potenti strumenti per identificare modelli interessanti ed evidenziare tendenze o valori anomali nei dati, tra le altre cose.
Informazioni sul periodo di allineamento
Il primo passaggio per aggregare i dati delle serie temporali è l'allineamento. L'allineamento crea una nuova serie temporale in cui i dati non elaborati vengono regolarizzati nel tempo in modo da poter essere combinati con altre serie temporali allineate. L'allineamento produce serie temporali con dati a intervalli regolari.
L'allineamento prevede due passaggi:
- Suddivisione della serie temporale in intervalli di tempo regolari, chiamata anche bucketing dei dati. L'intervallo è chiamato periodo di allineamento.
- Calcolo di un singolo valore della metrica per i punti nel periodo di allineamento. Puoi scegliere come viene calcolato il singolo punto: puoi sommare tutti i valori, calcolarne la media o utilizzare il valore massimo.
Il seguente diagramma mostra come viene utilizzato il periodo di allineamento per raggruppare i dati tra l'ora di inizio e l'ora di fine.
Il seguente diagramma mostra il risultato dell'utilizzo di un periodo di allineamento di cinque minuti con i seguenti passaggi:
- Creazione di un periodo di allineamento di cinque minuti.
- Calcolo del singolo valore della metrica utilizzando la somma dei valori della metrica dai dati non elaborati.
Granularità
Se sai che è successo qualcosa nell'arco di un paio di minuti e vuoi approfondire, probabilmente ti conviene utilizzare un periodo di un minuto per l'allineamento.
Se ti interessa esplorare le tendenze su periodi di tempo più lunghi, potrebbe essere più appropriato un periodo di allineamento più ampio. In genere, i periodi di allineamento lunghi non sono utili per esaminare condizioni anomale a breve termine, come picchi brevi nel traffico. Se utilizzi, ad esempio, un periodo di allineamento di più settimane, l'esistenza di un'anomalia in quel periodo può essere ancora rilevata, ma i dati allineati potrebbero essere troppo generici per essere di grande aiuto.
Per durate temporali lunghe, un periodo di allineamento più breve non è utile. Ad esempio, se selezioni un allineamento di 1 minuto per un periodo di 30 giorni, Flow Analyzer genera più di 43.000 punti dati. Poiché 43.000 punti dati sono 10 volte più numerosi dei pixel del display 4K, non puoi visualizzare tutti i dettagli e alcune opzioni sono disattivate per durate temporali elevate.
Opzioni di allineamento
Le opzioni di allineamento includono la somma dei valori, la ricerca del valore massimo, minimo o medio, la ricerca di un valore percentile scelto, il conteggio dei valori e altro ancora. Con Flow Analyzer puoi utilizzare varie aggregazioni delle metriche come opzioni di allineamento.
Se selezioni Byte inviati come tipo di metrica e Sorgente e destinazione come aggregazione del traffico, sono disponibili le seguenti opzioni.
- Traffico totale
- Frequenza media di traffico
- Frequenza mediana di traffico
- Frequenza di traffico P95
- Frequenza massima di traffico
Se selezioni Pacchetti inviati come tipo di metrica e Sorgente e destinazione come aggregazione del traffico, sono disponibili le seguenti opzioni.
- Pacchetti aggregati
- Velocità media pacchetti
- Frequenza mediana di pacchetti
- Frequenza di pacchetti P95
- Velocità massima di pacchetti
Il seguente diagramma mostra il risultato dell'utilizzo di due opzioni di allineamento del traffico totale e della tariffa di traffico media.
Utilizzo del periodo di allineamento
Puoi utilizzare l'opzione Periodo di allineamento per aggregare i flussi di traffico in intervalli di tempo della durata selezionata. Se necessario, puoi aumentare ulteriormente lo zoom sul grafico e visualizzare i dettagli specifici.
Passaggi successivi
- Analizzare i flussi di traffico
- Abilita Analisi dei log
- Configurare un bucket centrale
- Eseguire test di connettività da Flow Analyzer
- Monitorare i flussi di traffico
- Risolvere i problemi relativi ai dati in Flow Analyzer