Gestisci e monitora la tua infrastruttura Google Cloud

Last reviewed 2023-11-13 UTC

Dopo aver eseguito il deployment di un'applicazione in produzione in Google Cloud, potresti dover modificare l'infrastruttura utilizzata. Ad esempio, potresti dover cambiare i tipi di macchina delle VM o la classe di archiviazione dei bucket Cloud Storage. Questa parte della Guida all'affidabilità dell'infrastruttura Google Cloud riassume le linee guida per la gestione dei cambiamenti che puoi seguire per ridurre e il rischio di affidabilità delle risorse dell'infrastruttura. Questa parte descrive anche come monitorare la disponibilità dell'infrastruttura Google Cloud.

Esegui il deployment progressivo delle modifiche all'infrastruttura

Quando devi modificare l'infrastruttura Google Cloud, se possibile, esegui il deployment delle modifiche in produzione in modo graduale. Ad esempio, se cambiare i tipi di macchina delle VM, eseguire il deployment delle modifiche ad alcune VM una zona e monitorare gli effetti delle modifiche. Se riscontri problemi, ripristinare rapidamente lo stato stabile precedente dell'infrastruttura. Diagnosi e risolvere i problemi e riavviare il processo di deployment progressivo. Dopo il giorno verificando che il carico di lavoro venga eseguito come previsto, esegui il deployment graduale delle modifiche in tutta la tua infrastruttura.

Controllare le modifiche alle risorse globali

Quando modifichi risorse globali come reti VPC e bilanciatori del carico globali, presta particolare attenzione a verificare le modifiche prima di eseguirne il deployment in produzione.

Poiché le risorse globali sono resilienti alle interruzioni di zone e regioni, potresti di utilizzare singole istanze di determinate risorse globali nella tua architettura. In questi deployment, le risorse globali possono diventare single point of failure. Ad esempio, se inavvertitamente aver configurato in modo errato una regola di forwarding del bilanciatore del carico globale, il frontend può smettere di ricevere o elaborare le richieste degli utenti. In effetti, il non è disponibile per gli utenti in questo caso se il backend è intatto. Per evitare situazioni simili, esercita un controllo rigoroso sulle modifiche alle risorse globali. Ad esempio, nel processo di revisione delle modifiche, puoi classificare modifiche alle risorse globali come modifiche ad alto rischio che devono essere verificati e approvati.

Monitorare la disponibilità dell'infrastruttura Google Cloud

Puoi monitorare lo stato attuale dei servizi Google Cloud tutte le regioni utilizzando Dashboard di Google Cloud Service Health. Puoi anche visualizzare una cronologia degli errori dell'infrastruttura (chiamati incidenti) per ciascun servizio. La pagina della cronologia fornisce i dettagli di ogni incidente, ad esempio la durata, le zone e le regioni interessate, i servizi interessati e eventuali soluzioni alternative consigliate.

Puoi anche visualizzare gli incidenti pertinenti al tuo progetto utilizzando Servizio Service Health personalizzato. Service Health consente inoltre di richiedere informazioni sugli incidenti utilizzando un'API su una in base al progetto o all'organizzazione e consente di configurare gli avvisi.

Google fornisce aggiornamenti regolari sullo stato di ogni incidente, inclusa un'indicazione del tempo stimato per il prossimo aggiornamento. Puoi ricevere in modo programmatico aggiornamenti sullo stato per gli incidenti usando un feed RSS. Per saperne di più, consulta Incidenti e la dashboard dell'integrità del servizio Google Cloud.