Metriche e visualizzazioni di Performance Dashboard

In questa pagina vengono descritte le metriche utilizzate per determinare le prestazioni delle risorse del progetto Google Cloud e dell'intero progetto Google Cloud. Puoi anche trovare dettagli sulle varie viste che mostrano ulteriori dettagli su queste metriche delle prestazioni.

Metriche

Performance Dashboard offre due tipi di metriche: perdita di pacchetti e latenza (tempo di round trip o RTT). Per ottenere le metriche di perdita di pacchetti per il tuo progetto Google Cloud, devi disporre di un numero sufficiente di VM nel progetto. Per ottenere le metriche di latenza, hai bisogno di una quantità di traffico sufficiente. Inoltre, Performance Dashboard non richiede alcuna configurazione.

Nelle sezioni seguenti vengono descritte entrambe le metriche in modo più dettagliato.

Perdita pacchetti

Le metriche relative alla perdita di pacchetti mostrano i risultati di un probe attivo tra i seguenti:

  • all'interno di una singola rete VPC.

  • VM nelle reti VPC in peering, quando una o entrambe le reti si trovano all'interno del progetto. Se le reti in peering si trovano in progetti diversi, la perdita di pacchetti è visibile nel progetto di destinazione.

  • VM in una rete VPC condiviso utilizzata dal tuo progetto. La perdita di pacchetti tra due progetti che utilizzano una rete VPC condiviso è visibile nel progetto di servizio di destinazione.

Ad esempio, supponiamo che il progetto A includa due reti VPC: la rete A, che ha VM solo nella zona A, e la rete M, che ha VM solo nella zona M. Se queste due reti sono in peering, Performance Dashboard del progetto A mostra i dati sulla perdita di pacchetti per la coppia di zone A/M. Se le reti non sono in peering, Performance Dashboard non mostra la metrica di perdita di pacchetti per quella coppia di zone.

Se queste due reti non si trovano nello stesso progetto, prendi nota quando Performance Dashboard di ogni rete mostra le metriche. Supponiamo che la rete A faccia parte del progetto A e che la rete M faccia parte del progetto M. Quando le reti sono in peering, Performance Dashboard del progetto M mostra i dati sulla perdita di pacchetti per le situazioni in cui la zona M è la zona di destinazione. Al contrario, se la zona A è quella di destinazione, i dati relativi alla perdita di pacchetti sono visibili solo al progetto A. Se le reti non sono in peering, né Performance Dashboard del progetto mostra i dati sulla perdita di pacchetti per la coppia di zone.

I dati raccolti tramite tutti i probe vengono aggregati in Performance Dashboard. In altre parole, Performance Dashboard non ti consente di isolare i dati sulla perdita di pacchetti all'interno del progetto rispetto ad altri tipi (ad esempio la perdita di pacchetti relativa a una rete VPC in peering in un altro progetto). Tuttavia, puoi utilizzare Monitoring per visualizzare risultati più dettagliati. Per maggiori informazioni, consulta Riferimento alle metriche di Performance Dashboard.

Performance Dashboard non invia probe sulle connessioni Cloud VPN.

Metodologia

Performance Dashboard esegue i worker sugli host fisici che ospitano le tue VM. Questi worker inseriscono e ricevono pacchetti di probe in esecuzione sulla stessa rete del tuo traffico. Poiché i worker vengono eseguiti sugli host fisici e non sulle VM, non consumano risorse delle VM e il traffico non è visibile sulle VM.

I probe coprono l'intera mesh di VM che possono comunicare tra loro, il che non è necessariamente uguale al pattern di traffico. Pertanto, potresti vedere indicazioni della perdita di pacchetti in Performance Dashboard, ma non prove della perdita di pacchetti nell'applicazione.

Per tutte le VM sottoposte a probe, Google Cloud tenta di accedere alla VM utilizzando il proprio indirizzo IP interno e quello esterno (se esistente). I probe non escono da Google Cloud, ma utilizzando indirizzi IP esterni, Performance Dashboard può coprire parte del percorso utilizzato dal traffico esterno, ad esempio quello proveniente da internet.

La perdita di pacchetti per gli indirizzi IP interni viene misurata utilizzando pacchetti UDP, mentre per gli indirizzi IP esterni viene misurata tramite pacchetti TCP.

Disponibilità delle metriche e livelli di confidenza

Performance Dashboard rileva un sottoinsieme di tutte le coppie VM-VM nella rete. I dati raccolti vengono quindi utilizzati per stimare la perdita di pacchetti che potresti riscontrare. L'affidabilità di Google nei dati dipende dalla frequenza di probe, che dipende dal numero di VM presenti in ciascuna zona e dal numero di zone in cui è stato eseguito il deployment delle VM. Ad esempio, avere 10 VM in due zone genera maggiore affidabilità rispetto a 10 VM in 10 zone.

Tutte le VM, incluse quelle create da Google Kubernetes Engine (GKE), vengono conteggiate nel numero totale di VM.

I diversi livelli di affidabilità sono descritti nella tabella seguente. Livelli di affidabilità inferiori sono segnalati nella mappa termica con un asterisco (*) o N/A.

Livello Numero richiesto di VM in ciascuna zona Dati mostrati da Performance Dashboard sulla mappa termica
95% di confidenza 10 VM moltiplicate per il numero di zone nel progetto. Ad esempio, se nel progetto sono presenti 12 zone, devi avere 120 VM in ciascuna zona. Una misurazione senza notazioni aggiuntive
90% di confidenza 2,5 VM moltiplicate per il numero di zone nel progetto. Ad esempio, se nel progetto sono presenti 12 zone, devi avere 30 VM in ciascuna zona. Una misurazione senza notazioni aggiuntive
Scarsa affidabilità Una misura con un asterisco
Insufficienti probe per avere dati significativi N/A

Le metriche di perdita di pacchetti di Google Cloud sono sempre disponibili. Se ci sono meno di 400 probe al minuto, viene visualizzato un asterisco (*).

Latenza specifica del progetto

Le metriche di latenza vengono misurate utilizzando il traffico dei clienti tra:

  • VM all'interno di una singola rete VPC
  • VM tra reti VPC in peering, se le reti si trovano nello stesso progetto
  • VM ed endpoint internet

Inoltre, Performance Dashboard per un progetto di servizio all'interno di una rete VPC condiviso mostra i dati solo per le zone all'interno del progetto di servizio. Supponiamo che una VM nella zona A e il progetto di servizio A utilizzino il progetto host per comunicare con una VM nella zona B e il progetto di servizio B. Le misurazioni relative a questo traffico non sono disponibili per il progetto di servizio o per il progetto host.

Latenza di Google Cloud

Le metriche di latenza vengono misurate utilizzando il traffico effettivo dei clienti tra:

  • VM all'interno di una singola rete VPC
  • VM tra reti VPC in peering
  • VM ed endpoint internet

Metodologia per la latenza del progetto e di Google Cloud

La latenza viene misurata mediante l'uso di pacchetti TCP.

In base a un campione del traffico effettivo, la latenza viene calcolata come il tempo che intercorre tra l'invio di un numero di sequenza TCP (SEQ) e la ricezione di un valore ACK corrispondente che contiene il ritardo relativo allo stack RTT di rete e TCP. La dashboard mostra la latenza come mediana di tutte le misurazioni pertinenti.

La metrica di latenza si basa sulla stessa origine dati e sulla stessa metodologia di campionamento dei log di flusso VPC.

La latenza specifica del progetto si basa su campioni del tuo progetto. La latenza di Google Cloud si basa su campioni provenienti da tutto Google Cloud.

Le metriche di latenza globale derivano da un campionamento passivo delle intestazioni del traffico TCP e non attraverso un probe attivo da Google Cloud agli endpoint internet.

Anomalie delle metriche di latenza

Nota le seguenti anomalie nelle metriche di latenza:

  • Per ambienti a bassa frequenza, Network Intelligence Center utilizza probe da 60 secondi per le metriche di latenza. Pertanto, le metriche RTT basate sul campionamento dei pacchetti potrebbero segnalare erroneamente livelli di latenza elevati quando i servizi basati su TCP restituiscono una risposta ritardata a livello di applicazione. Di solito è possibile riconoscere livelli RTT imprecisi controllando se corrispondono a ritardi a livello di applicazione.

    Sebbene il servizio basato su TCP risponda rapidamente con un ACK, il campionamento non rileva l'ACK e conteggia una risposta dati successiva come ACK di chiusura a un SEND molto precedente, il che distorce la misurazione RTT complessiva. In questi casi, puoi ignorare le metriche RTT.

  • A volte, i dati di latenza specifici del progetto non si allineano con i dati di latenza globali. Un tale disallineamento può verificarsi se il set di dati globale incorpora anche altri percorsi di rete con latenze significativamente diverse rispetto al percorso di rete utilizzato dal progetto specifico.

Disponibilità delle metriche

La metrica di latenza di Google Cloud è sempre disponibile. La metrica di latenza per progetto è disponibile solo se il traffico TCP è di circa 1000 pacchetti al minuto o superiore.

Tabella di riepilogo delle metriche

La seguente tabella riassume i metodi e i protocolli di indagine utilizzati per segnalare le metriche di perdita di pacchetti e latenza.

Perdita pacchetti Latenza
Metodo di probe Probing attivo (traffico VM sintetico) Probing passivo (traffico VM effettivo)
Protocollo UDP (indirizzo IP interno), TCP (indirizzo IP esterno) TCP (indirizzi IP interni/esterni)

Visualizzazioni latenza

I dettagli della latenza per il tipo di traffico da Internet a Google Cloud sono disponibili in tre visualizzazioni: Tabella, Mappa e Cronologia.

Visualizzazione tabella

La visualizzazione Tabella mostra il RTT mediano tra le aree geografiche selezionate e le regioni che contengono istanze VM nel tuo progetto. La tabella include i seguenti dettagli:

  • Paese: il nome del paese.
  • Città: il numero di città. Puoi visualizzare i dettagli della latenza di ogni città specifica nel grafico dei dettagli del paese.
  • Regioni di destinazione: il numero di regioni di destinazione con traffico per gli utenti di un determinato paese.
  • Latenza mediana: il valore RTT mediano, in millisecondi, tra il paese e le regioni.

Visualizzazione mappa

La visualizzazione Mappa mostra le posizioni geografiche (aree metropolitane o città) e le regioni di Google Cloud.

  • Visualizza la latenza mediana di località specifiche e regioni Google Cloud.
  • Seleziona una regione Google Cloud e visualizza le località con traffico verso la regione selezionata.
  • Visualizza i dettagli specifici per località in un grafico della latenza nella barra laterale.
  • Cerca un luogo utilizzando la casella di ricerca sulla mappa.

Le località sono classificate in diverse tonalità di blu per indicare gli intervalli di latenza mediana sulla mappa. Nell'immagine di seguito, il colore di un cerchio che mostra una data città su una mappa globale può avere una tonalità di blu. Più scura è la tonalità di blu, maggiore è la latenza della città in una determinata regione Google Cloud.

Intervalli di latenza mediana sulla mappa.
Intervalli di latenza mediana sulla mappa (fai clic per ingrandire).

Visualizzazione Timeline

La visualizzazione Sequenza temporale mostra il valore RTT mediano tra le aree geografiche selezionate e le regioni di Google Cloud. Fornisce le metriche di latenza attuali e sei settimane di dati storici. Potete usare i filtri per aggregare ulteriormente il traffico a livello di città, regione geografica e paese. Puoi visualizzare le metriche di latenza corrispondenti a coppie di regioni e località geografiche specifiche solo se per quella coppia è disponibile un traffico Google Cloud sufficiente.