Rivedere l'integrità e gli incidenti del servizio


Quando i cluster o le applicazioni Google Kubernetes Engine (GKE) riscontrano problemi, è fondamentale determinare rapidamente se la causa è interna o correlata a un'interruzione del servizio Google Cloud più ampia. Dedicare tempo al debug locale è inefficiente se la causa principale è un incidente noto della piattaforma.

Utilizza questa pagina per determinare se un problema con il tuo cluster GKE è causato da un'interruzione del servizio Google Cloud più ampia. Scopri dove trovare aggiornamenti di stato ufficiali, eventi di salute personalizzati e informazioni sugli incidenti di servizio dalle seguenti fonti:

  • Google Cloud Integrità del servizio: informazioni sullo stato dei servizi Google Cloud, per regione.
  • Personalized Service Health: interruzioni del servizio pertinenti ai tuoi progetti.
  • Approfondimenti e suggerimenti sugli incidenti del servizio: cluster GKE interessati da un incidente del servizio in corso.

Queste informazioni sono importanti per gli amministratori e gli operatori della piattaforma e per gli sviluppatori di applicazioni che risolvono i problemi e devono capire se i problemi osservati sono collegati a un evento di integrità del servizio Google Cloud più ampio. Per maggiori informazioni sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti diGoogle Cloud , consulta Ruoli e attività comuni degli utenti GKE.

Rivedi l'integrità dei servizi Google Cloud

La pagina Google Cloud Integrità del servizio fornisce informazioni sullo stato dei servizi che fanno parte di Google Cloud.

Per esaminare gli incidenti relativi a GKE, vai alla pagina Google Cloud Service Health.

Vai a tutti gli incidenti segnalati per Google Kubernetes Engine

Esaminare Personalized Service Health

Personalized Service Health ti consente di identificare interruzioni del servizioGoogle Cloud pertinenti per i tuoi progetti. Queste interruzioni sono chiamate eventi di integrità del servizio e le informazioni al riguardo sono disponibili nella console Google Cloud e in una varietà di punti di integrazione.

Per esaminare gli incidenti relativi a GKE pertinenti per i tuoi progetti, visualizza gli eventi di Service Health nella dashboard di Personalized Service Health nella console Google Cloud .

Vai a Personalized Service Health

Puoi filtrare gli incidenti per servizio, posizione, pertinenza e stato. La dashboard fornisce anche i dettagli dell'incidente, come l'ambito dell'impatto, i sintomi, le soluzioni alternative e gli aggiornamenti sullo stato di risoluzione. Per iniziare, consulta la guida rapida: visualizzare gli eventi di Service Health nella consoleGoogle Cloud .

Esaminare gli approfondimenti e i consigli relativi all'incidente del servizio

Approfondimenti e consigli sugli incidenti del servizio ti consentono di identificare i cluster GKE interessati da un incidente del servizio in corso.

Per ottenere approfondimenti sugli incidenti del servizio, visualizza approfondimenti e suggerimenti per il sottotipo GKE_RELIABILITY_INCIDENT. Puoi ottenere approfondimenti utilizzando la console Google Cloud , Google Cloud CLI o l'API Recommender. Per maggiori informazioni, vedi Visualizzare approfondimenti e consigli.

Gli approfondimenti e i consigli includono le seguenti informazioni:

  • Cluster interessato: un cluster interessato dall'incidente.
  • Nome dell'incidente: un identificatore dell'incidente da utilizzare come riferimento quando comunichi con l'assistenza clienti Google Cloud.
  • Descrizione dell'incidente: informazioni sull'incidente fornite dal team di risposta agli incidenti.
  • Ultima ora effettiva: l'ultima volta che le informazioni sull'incidente sono state aggiornate.
  • Azione di mitigazione: azione di mitigazione consigliata dal team di risposta agli incidenti, se disponibile.

L'approfondimento sull'incidente del servizio rimane visibile finché il team di risposta agli incidenti Google Cloud non mitiga l'incidente e non determina che l'approfondimento non è più pertinente. Ci sarà un ritardo tra il momento in cui l'incidente viene mitigato e non influisce più sulle tue risorse e il momento in cui l'approfondimento viene rimosso. Se hai implementato una soluzione alternativa e non vuoi più visualizzare l'approfondimento, puoi ignorarlo.

Passaggi successivi