Eseguire l'integrazione con Personalized Service Health

Sebbene le interruzioni del servizio siano inevitabili, una comunicazione trasparente e tempestiva è essenziale per valutare cosa sta succedendo, tenere informati gli stakeholder ed eseguire azioni per ridurre al minimo l'impatto sulla tua attività.

Il funzionamento di un'applicazione cloud affidabile è una responsabilità condivisa traGoogle Cloud e gli sviluppatori di applicazioni. Quando si verifica un'interruzione del servizio,Google Cloud si impegna a comunicare rapidamente l'evento e a fornire una valutazione dell'impatto. Devi valutare come ricevere notifiche, intervenire su incidenti emergenti e gestire l'impatto sulla tua applicazione.

Personalized Service Health può aiutarti in questa procedura. Puoi eseguire l'integrazione in vari modi per conoscere gli incidenti emergenti, valutare l'impatto sulle tue applicazioni e ricevere aggiornamenti da Google Cloud. Questo documento fornisce una panoramica di come ricevere indicatori di interruzioni del servizio daGoogle Cloud, inclusi consigli per l'integrazione.

Decidi dove eseguire l'integrazione

Google Cloud offre i seguenti prodotti per aiutarti a comprendere lo stato dei prodotti: Google Cloud

  • Integrità dei servizi Google Cloud: fornisce una panoramica completa della piattaforma di tutti Google Cloud i prodotti in tutte le località. Copre incidenti con un ambito e una gravità più ampi ed è disponibile nei seguenti modi:
  • Personalized Service Health: fornisce una visualizzazione personalizzata dei Google Cloud prodotti utilizzati dai tuoi progetti o dalla tua organizzazione. Copre una gamma più ampia di incidenti rispetto a quelli pubblicati in Service Health di Google Cloud. Personalized Service Health è disponibile nei seguenti paesi:

Ti consigliamo di eseguire l'integrazione con Personalized Service Health per usufruire della copertura e della gamma di opzioni di integrazione più ampie.

Punto di integrazione Caso d'uso Vantaggi Dipendenze
Dashboard della console (Personalized Service Health) Visualizza le interruzioni attive Personalizzati in base ai tuoi progetti, disponibili per impostazione predefinita Identity and Access Management (IAM)
console Google Cloud
Avvisi (Personalized Service Health) Notifiche proattive Personalizzati in base ai tuoi progetti, pratici e proattivi IAM
Cloud Logging
Monitoring
API (Personalized Service Health) Integrazione con un altro sistema o strumento Personalizzati per i tuoi progetti o la tua organizzazione IAM

Scegliere il metodo di interazione con Personalized Service Health

Devi considerare Personalized Service Health nel contesto delle operazioni, del monitoraggio e del modello di risposta agli incidenti previsti. Valutando il modo in cui i tuoi team utilizzano gli indicatori durante e prima degli incidenti, puoi decidere come utilizzare Personalized Service Health.

La tabella seguente mostra in che modo potresti interagire con lo stato dei servizi personalizzato, a seconda della configurazione.

Scenario di esempio nella tua organizzazione Integrazione con Personalized Service Health Esempi di strumenti con cui potresti eseguire l'integrazione
Sviluppatori disponibili per alcune applicazioni Avvisi per singoli progetti

Dashboard della console

Google Cloud Observability, PagerDuty
Risposta agli incidenti centralizzata in un'organizzazione Integrazione dell'API con il sistema esistente utilizzando l'API OrganizationEvents (v1, v1beta) PagerDuty, dashboard personalizzate
Piattaforma interna per gestire le risorse e le operazioni del cloud API Service Health
Avvisi per singoli progetti
Integrazione dell'API Service Health con una piattaforma per sviluppatori interna
Backstage, Terraform
Molti progetti configurati e gestiti tramite programmazione (ad es. più di 1000) API Service Health
Notifiche automatiche basate su API
Backstage, Terraform, PagerDuty

Utilizzare Personalized Service Health durante un incidente

Una volta completata l'integrazione con Personalized Service Health e iniziate a ricevere notifiche di avviso, Personalized Service Health fornisce informazioni sulle interruzioni Google Cloudche possono aiutarti a gestire il loro impatto.

Rileva e definisci l'ambito dell'incidente

Ecco alcune domande che potresti porre in questa fase:

  • È un problema reale?
  • Puoi convalidare l'impatto?
  • Quali sono i sintomi?
  • Quali utenti, prodotti o parti dell'attività sono interessati? Quali regioni?

L'integrità dei servizi personalizzati ti aiuta a capire se il problema proviene dal tuo progetto o da Google, in modo da poter implementare la risposta appropriata all'incidente. Ti consente di trovare e visualizzare le informazioni sugli eventi in modo da poter monitorare l'evento, i prodotti interessati e le località che influiscono sul tuo progetto.

Ecco alcuni passaggi che puoi seguire:

  1. Controlla l'avviso, se lo hai configurato.
    • Cosa ha attivato questo avviso?
    • In che modo questi avvisi si inseriscono in tutti gli altri avvisi potenzialmente specifici per prodotto?
  2. Accedi alla dashboard di stato del servizio per il tuo progetto o la tua organizzazione. Puoi visualizzare gli eventi, i prodotti e le località interessati in un colpo d'occhio e rispondere alle seguenti domande:
    • Quali dei tuoi progetti sono interessati?
    • Quali prodotti su cui si basa il tuo progetto sono interessati?
    • L'evento interessa risorse specifiche all'interno di queste località?
  3. Esamina gli eventi e comprendine l'ambito, l'impatto e la pertinenza per il tuo progetto.
  4. Identifica un evento che sembra correlato al problema che stai riscontrando.
  5. Trova i passaggi di verifica, le misure di mitigazione (se disponibili) e il tempo di risoluzione previsto per l'evento.

Personalized Service Health ti aiuta a esaminare lo stato attuale e l'impatto degli incidenti che interessano il tuo progetto o la tua organizzazione, in modo da poterli gestire e rispondere in modo efficiente. Ad esempio, puoi dare la priorità in modo efficace identificando con precisione l'incidente con la priorità più elevata.

Ridurre al minimo, risolvere o riassegna l'incidente

Ecco alcune domande che potresti porre in questa fase:

  • Come puoi aggirare l'incidente?
  • Puoi risolvere il problema direttamente?
  • Vuoi avviare un failover ora o aspettare ancora?
  • A chi devi inviare una notifica per risolvere il problema?

L'integrità dei servizi personalizzati ti aiuta a comprendere l'impatto di un incidente sui tuoi progetti e sulle tue risorse, a ricevere informazioni sulle soluzioni alternative disponibili e a ricevere aggiornamenti sul tempo di risoluzione stimato.

Monitorare l'avanzamento verso la risoluzione degli incidenti

La panoramica degli eventi nella dashboard Integrità del servizio identifica informazioni chiave come sintomi e soluzioni alternative, necessarie per la mitigazione, e mostra quando cambia lo stato. Questi dettagli ti consentono di:

  • Monitora un riepilogo continuo dell'impatto potenziale man mano che la situazione si evolve.
  • Ricevere aggiornamenti su eventuali sviluppi e sull'orario previsto della prossima comunicazione o dell'aggiornamento.
  • Scopri quando viene pubblicato un sintomo.
  • Scopri quando viene identificata una soluzione alternativa.
  • Controlla quando lo stato diventa Risolto.

Mentre monitori l'avanzamento, puoi eseguire le seguenti azioni:

  • Esamina le soluzioni alternative, se disponibili.
  • Implementa la risposta agli incidenti appropriata per il tuo progetto o la tua organizzazione.
  • Continua a monitorare l'evento finché non viene attenuato o risolto.

Quando contattare l'assistenza

Google è a conoscenza degli eventi visualizzati nella dashboard di Service Health. Per sapere cosa sta facendo Google in merito a un evento, selezionalo per visualizzarne i dettagli.

Se un problema non sembra essere rappresentato in nessuno degli eventi della dashboard, contatta l'assistenza.

Utilizzare Personalized Service Health con altre fonti di informazioni sugli incidenti

Indipendentemente dalla configurazione della tua azienda, utilizza lo stato del servizio personalizzato come indicatore aggiuntivo per valutare l'impatto degli incidenti. Assicurati di poter esaminare più fonti di informazioni sugli incidenti per decidere i passaggi successivi in base a dati e prove.

Ecco alcuni motivi per utilizzare più fonti di informazioni sugli incidenti:

  • Un Google Cloud prodotto potrebbe essere interessato da un incidente in qualche località, ma i tuoi progetti potrebbero non essere interessati perché si trovano in una località diversa.
  • Se il sistema di pubblicazione ha due repliche complete in zone separate e un prodotto Google Cloud critico in una zona non funziona, lo stato del servizio personalizzato ti informerà dell'errore. Tuttavia, è possibile che i tuoi utenti non siano effettivamente interessati e che tu non debba intervenire immediatamente.
  • Se il tuo progetto dipende da molti Google Cloud prodotti all'interno di una località, Personalized Service Health non saprà:
    • Se il tuo progetto richiede che tutti i prodotti siano funzionali.
    • Se il progetto continuerà a funzionare nel caso in cui un prodotto non vada a buon fine.
    • Se l'intera applicazione è interessata se uno o più prodotti non vanno a buon fine.
  • Anche Personalized Service Health può subire un degrado o un errore. Per verificare, puoi controllare lo stato.

Dovrai interpretare gli indicatori di Personalized Service Health in base alla tua configurazione.