Gestisci e monitora la tua infrastruttura Google Cloud

Last reviewed 2024-11-20 UTC

Dopo aver eseguito il deployment di un'applicazione in produzione in Google Cloud, potresti dover modificare l'infrastruttura utilizzata. Ad esempio, potresti dover cambiare i tipi di macchine delle VM o la classe di archiviazione dei bucket Cloud Storage. Questa parte della guida all'affidabilità dell'infrastruttura di Google Cloud riassume le linee guida per la gestione del cambiamento che puoi seguire per ridurre il risico di affidabilità delle risorse di infrastruttura. Questa parte descrive anche come monitorare la disponibilità dell'infrastruttura Google Cloud.

Esegui il deployment delle modifiche dell'infrastruttura in modo progressivo

Quando devi modificare l'infrastruttura Google Cloud, se possibile, esegui il deployment delle modifiche in produzione in modo graduale. Ad esempio, se devi cambiare i tipi di macchine delle VM, esegui il deployment delle modifiche su alcune VM in una zona e monitora gli effetti delle modifiche. Se rilevi problemi, ripristina rapidamente l'infrastruttura allo stato stabile precedente. Diagnostica e risolvi i problemi, quindi riavvia la procedura di deployment progressivo. Dopo aver verificato che il tuo workload funzioni come previsto, esegui gradualmente il deployment delle modifiche in tutta l'infrastruttura.

Controllare le modifiche alle risorse globali

Quando modifichi risorse globali come reti VPC e bilanciatori del carico globali, presta particolare attenzione a verificare le modifiche prima di eseguirne il deployment in produzione.

Poiché le risorse globali sono resilienti alle interruzioni di zone e regioni, potresti decidere di utilizzare singole istanze di determinate risorse globali nella tua architettura. In questi casi, le risorse globali possono diventare single point of failure. Ad esempio, se configuri per errore una regola di forwarding del bilanciatore del carico globale, il frontend può smettere di ricevere o elaborare le richieste degli utenti. In questo caso, l'applicazione non è disponibile per gli utenti, anche se il backend è intatto. Per evitare queste situazioni, esercita un controllo rigoroso sulle modifiche alle risorse globali. Ad esempio, nella procedura di revisione delle modifiche, puoi classificare eventuali modifiche alle risorse globali come modifiche ad alto rischio che altri revisori devono verificare e approvare.

Monitorare la disponibilità dell'infrastruttura Google Cloud

Puoi monitorare lo stato attuale dei servizi Google Cloud in tutte le regioni utilizzando la Dashboard dell'integrità dei servizi Google Cloud. Puoi anche visualizzare una cronologia degli errori dell'infrastruttura (chiamati incidenti) per ciascun servizio. La pagina della cronologia fornisce i dettagli di ogni incidente, ad esempio la durata, le zone e le regioni interessate, i servizi interessati e eventuali soluzioni alternative consigliate.

Puoi anche visualizzare gli incidenti pertinenti al tuo progetto utilizzando Personalized Service Health. Service Health ti consente anche di richiedere informazioni sugli incidenti utilizzando un'API su base per progetto o per organizzazione e di configurare gli avvisi.

Google fornisce aggiornamenti regolari sullo stato di ogni incidente, inclusa un'indicazione del tempo stimato per il prossimo aggiornamento. Puoi ricevere aggiornamenti sullo stato degli incidenti tramite programmazione utilizzando un feed RSS. Per saperne di più, consulta Incidenti e la dashboard di Google Cloud Service Health.