Indicatori di livello di servizio (SLI) trasparenti di Stackdriver

Monitora i servizi Google Cloud e i loro effetti sui tuoi carichi di lavoro.

stackdriver-sre-hero-banner

L'IT moderno funziona sui numeri

Un approccio completo e orientato alla metrica è ora un obiettivo di base per la maggior parte dei team operativi IT. Molte aziende adesso misurano l'IT sulla disponibilità e le prestazioni del servizio. Ma per i team IT che dipendono dai servizi cloud può essere difficile ottenere dati affidabili sui servizi forniti da un provider cloud esterno. Se c'è un problema, dov'è? Con il tuo stack o con il fornitore di servizi? Gli SLI trasparenti consentono di monitorare i servizi di Google Cloud e i loro effetti sui carichi di lavoro, in modo da ottenere una visibilità completa.

measure-all-the-things

Misura tutte le cose

Per aiutare l'IT a comprendere le prestazioni di tutti i componenti dei servizi, Google fornisce metriche dettagliate sul livello delle API per oltre 130 servizi Google Cloud. Queste metriche mostrano la latenza e il numero degli errori per le richieste delle tue applicazioni a ogni servizio Google. Ciò consente di visualizzare le correlazioni e gli effetti collaterali tra le applicazioni e i servizi da cui dipendono, contribuendo a velocizzare l'analisi delle cause principali e il tempo di risoluzione.

real-transparency

Reale trasparenza

Gli SLI vanno ben oltre le tradizionali nozioni di "stato dei servizi". Puoi visualizzare le interazioni specifiche tra i servizi ed eseguire una correlazione con i dati ambientali. Ciò consente di incrociare le metriche di servizio tramite una varietà di attributi come la posizione del servizio, le credenziali dell'app che chiama il servizio, la versione e il codice di risposta per aiutarti a esplorare le relazioni e determinare cause ed effetti.

SLI trasparenti in azione

  • Se tutte le chiamate a un servizio falliscono per un utente ma non per un altro, è probabile che ci sia qualcosa di sbagliato in quell'account che puoi facilmente risolvere da solo.
  • Se stai risolvendo un problema con la tua app e noti una correlazione tra le prestazioni limitate della tua applicazione e un prolungato aumento della latenza per un servizio GCP critico, questo è il momento di contattarci e richiedere assistenza.
  • Se le latenze per un servizio GCP riportano un aspetto positivo e invariato rispetto a prima, ma le metriche in-app segnalano che la latenza delle chiamate al servizio è eccessivamente alta, ciò indica che potrebbero esserci problemi nella rete. Contatta il tuo operatore di rete (in alcuni casi, Google) per avviare il processo di debug.

Il nostro impegno per la trasparenza

Google Cloud si impegna a condividere informazioni dettagliate sulle prestazioni dei nostri servizi. Queste informazioni sono simili ai dati utilizzati dagli SRE di Google per mantenere i nostri servizi attivi e funzionanti. Con questi dati condivisi, puoi facilmente monitorare le nostre attività in modo che, quando si lavora insieme su un ticket di servizio, tutti siano sulla stessa lunghezza d'onda. Riteniamo che gli SLI trasparenti miglioreranno la tua esperienza di assistenza tecnica e aumenteranno la tua fiducia nel cloud computing.

Google Cloud

Per iniziare

Per iniziare a raccogliere ed esplorare metriche di servizio trasparenti, accedi a Stackdriver Metrics Explorer e seleziona "API utilizzata" come tipo di risorsa. Vedrai un elenco di metriche che puoi registrare in base ai prodotti e ai servizi che stai utilizzando nella tua applicazione. Puoi quindi scegliere le metriche che hanno più senso per il tuo ambiente. Riduci i dati visualizzati specificando quale servizio, metodo, posizione, credenziale o codice di errore vuoi monitorare.

Dopo aver deciso quali sono le metriche più importanti per la tua app, dovresti creare dashboard personalizzate che associno i tuoi indicatori chiave ai nostri, in modo da ottenere la visualizzazione completa necessaria per individuare la causa generale di un problema. Infine, una volta che hai una buona base di riferimento a lungo termine su come i servizi di Google si comportano sul tuo traffico e su quale sia la tolleranza della tua app, potresti prendere in considerazione l'impostazione di avvisi per essere avvertito in caso di devianza dal comportamento a lungo termine.

Per iniziare