Componenti di base per il ripristino di emergenza

Last reviewed 2024-07-01 UTC

Questo documento è la seconda parte di una serie che tratta Ripristino di emergenza (RE) in Google Cloud. Questa sezione illustra i servizi e i prodotti che puoi utilizzare i componenti di base per il tuo piano di RE, sia per i prodotti che per i prodotti Google Cloud che funzionano su più piattaforme.

La serie è costituita dai seguenti componenti:

Google Cloud offre un'ampia gamma di prodotti che puoi utilizzare nell'ambito per il ripristino di emergenza. Questa sezione illustra gli aspetti correlati a RE dei prodotti più comunemente usati come RE di Google Cloud i componenti di base.

Molti di questi servizi hanno funzionalità ad alta disponibilità. ad alta disponibilità ma molti degli obiettivi dell'alta disponibilità si applicano anche alla progettazione di un piano di RE. Ad esempio, sfruttando le funzionalità ad alta disponibilità, puoi progettare architetture che ottimizzano l'uptime e possono mitigare gli effetti di guasti su scala ridotta, ad esempio in caso di errore di una singola VM. Per ulteriori informazioni sulla relazione tra RE e HA, vedi il Guida alla pianificazione del ripristino di emergenza.

Le sezioni seguenti descrivono questi componenti di base per la RE di Google Cloud come possono aiutarti a implementare i tuoi obiettivi di RE.

Computing e archiviazione

La tabella seguente fornisce un riepilogo delle funzionalità dei servizi di computing e archiviazione di Google Cloud che fungono da componenti di base per il RE:

Prodotto Funzionalità
Compute Engine
  • Risorse di calcolo scalabili
  • Tipi di macchina predefinita e personalizzata
  • Tempi di avvio rapidi
  • Snapshot
  • Modelli di istanza
  • Gruppi di istanze gestite
  • Prenotazioni
  • Dischi permanenti
  • Manutenzione trasparente
  • Migrazione live
Cloud Storage
  • Archiviazione di oggetti a elevata durabilità
  • Ridondanza tra regioni
  • Classi di archiviazione
  • Gestione del ciclo di vita degli oggetti
  • Trasferimento di dati da altre origini
  • Crittografia at-rest per impostazione predefinita
  • Eliminazione temporanea
Google Kubernetes Engine (GKE)
  • Ambiente gestito per il deployment e la scalabilità containerizzati applicazioni
  • Riparazione automatica dei nodi
  • Probe di attività e idoneità
  • I volumi permanenti
  • Cluster multizona e a livello di regione
  • Networking multi-cluster

Per ulteriori informazioni su come le funzionalità e il design di questi e altri I prodotti Google Cloud potrebbero influenzare la tua strategia di RE, vedi Architettura per il ripristino di emergenza in caso di interruzioni dell'infrastruttura cloud: riferimenti di prodotto.

Compute Engine

Compute Engine fornisce istanze di macchine virtuali (VM); è il cavallo di battaglia di Google Cloud. Nella oltre a configurare, avviare e monitorare Compute Engine di Compute Engine, in genere si utilizzano varie funzionalità correlate per implementare un piano di RE.

Per gli scenari di RE, puoi impedire l'eliminazione accidentale delle VM impostando elimina flag protezione. Ciò è particolarmente utile se ospiti servizi stateful come o Microsoft SQL Server.

Per informazioni su come rispettare valori di RTO e RPO bassi, consulta Progettazione di sistemi resilienti.

Modelli di istanza

Puoi usare Compute Engine Modelli di istanza per salvare i dettagli di configurazione della VM e creare istanze di Compute Engine da modelli di istanza esistenti. Puoi utilizzare il modello per avviare tutte le istanze che ti servono, configurato esattamente nel modo che preferisci quando devi supportare il tuo RE nell'ambiente di destinazione. I modelli di istanza vengono replicati a livello globale, di ricreare l'istanza ovunque in Google Cloud con la stessa configurazione.

Per maggiori informazioni, consulta le seguenti risorse:

Per maggiori dettagli sull'utilizzo delle immagini Compute Engine, consulta bilanciare configurazione dell'immagine e velocità di deployment più avanti in questo documento.

Gruppi di istanze gestite

Gruppi di istanze gestite lavorare con Cloud Load Balancing (considerato più avanti in questo documento) distribuiscono il traffico a gruppi di istanze con configurazione identica che copiati in più zone. I gruppi di istanze gestite consentono funzionalità come di scalabilità automatica e riparazione automatica, per cui il gruppo di istanze gestite e ricrearle automaticamente.

Prenotazioni

Compute Engine consente prenotazione di istanze VM in uno specifico utilizzando tipi di macchina personalizzata o predefinita, con o senza GPU aggiuntive SSD locali o SSD. Per garantire la capacità per i carichi di lavoro mission critical per RE, devi creare prenotazioni nelle zone di destinazione di RE. Senza su richiesta, c'è la possibilità che tu non riceva necessaria per raggiungere il tuo Recovery Time Objective (RTO). Le prenotazioni possono essere è utile in scenari di RE a caldo, freddo o caldo. Ti permettono di recuperare disponibili per il failover per soddisfare esigenze RTO più basse, senza dover configurarli e eseguirne il deployment in anticipo.

Dischi permanenti e snapshot

Dischi permanenti sono dispositivi di archiviazione di rete durevoli a cui possono accedere le tue istanze. Loro sono indipendenti dalle istanze, quindi puoi scollegare e spostare per conservare i dati anche dopo aver eliminato le istanze.

Puoi creare backup incrementali o snapshot delle VM di Compute Engine che puoi copiare tra regioni e utilizzarli per ricreare i dischi permanenti di una calamità. Inoltre, puoi crea snapshot di dischi permanenti per evitare la perdita di dati dovuta a un errore dell'utente. Gli snapshot sono incrementali, e di richiedere solo pochi minuti per la creazione, anche se i dischi degli snapshot sono collegati di Compute Engine in esecuzione.

I dischi permanenti sono dotati di ridondanza integrata per proteggere i dati guasti delle apparecchiature e garantire la disponibilità dei dati attraverso il data center di manutenzione. I dischi permanenti sono a livello di zona o di regione. A livello di regione i dischi permanenti replicano le scritture su due zone di una regione. Nel caso in cui a livello di zona, un'istanza VM di backup può eseguire il collegamento forzato di un disco permanente a livello di regione nella zona secondaria. Per saperne di più, vedi Opzioni di alta disponibilità utilizzando dischi permanenti a livello di regione.

Manutenzione trasparente

Google gestisce regolarmente la propria infrastruttura applicando patch ai sistemi con software più recente ed eseguire test di routine e manutenzione preventiva per garantire che l'infrastruttura di Google sia veloce ed efficiente possibile.

Per impostazione predefinita, tutte le istanze di Compute Engine sono configurate in modo che questi che gli eventi di manutenzione siano trasparenti per le tue applicazioni e i tuoi carichi di lavoro. Per ulteriori informazioni le informazioni, vedi Manutenzione trasparente.

Quando si verifica un evento di manutenzione, Compute Engine utilizza Migrazione live per eseguire automaticamente la migrazione delle istanze in esecuzione a un altro host zona di destinazione. La migrazione live consente a Google di eseguire la manutenzione, essenziale mantenere l'infrastruttura protetta e affidabile senza interrompere per le tue VM.

Strumento di importazione dei dischi virtuali

La importazione di dischi virtuali consente di importare formati di file tra cui VMDK, VHD e RAW in per creare nuove macchine virtuali Compute Engine. Con questo strumento puoi creare di macchine virtuali Compute Engine che hanno la stessa configurazione di macchine virtuali on-premise. È un buon approccio quando non in grado di configurare immagini Compute Engine dai programmi binari di origine già installato sulle tue immagini.

Backup automatici

Puoi automatizzare i backup delle tue istanze Compute Engine utilizzando i tag. Per Ad esempio, puoi creare un modello di piano di backup utilizzando il servizio di backup e RE il modello verrà applicato automaticamente alle istanze Compute Engine.

Per ulteriori informazioni, vedi Automatizzare la protezione delle nuove istanze di Compute Engine.

Cloud Storage

Cloud Storage è un archivio di oggetti ideale per archiviare i file di backup. Offre diverso classi di archiviazione adatte a casi d'uso specifici, come descritto nel diagramma seguente.

Diagramma che mostra Standard Storage per l'accesso ad alta frequenza, Nearline e Coldline per l'accesso a bassa frequenza e Archive per l'accesso a bassa frequenza

Negli scenari RE, Nearline, Coldline e Archive Storage sono particolarmente interesse. Queste classi di archiviazione riducono i costi di archiviazione Standard Storage. Tuttavia, sono previsti costi aggiuntivi associati al recupero di dati o metadati archiviati in queste classi, nonché le durate minime di archiviazione che ti vengono addebitate. Nearline è progettata per scenari di backup in cui l'accesso avviene al massimo una volta al mese, è ideale per eseguire regolari test di stress RE mentre tenendo bassi i costi.

Le classi Nearline, Coldline e Archive sono ottimizzate per applicazioni e il modello di determinazione del prezzo è progettato tenendo conto di questo aspetto. Pertanto, addebitato per durate minime di archiviazione e sono disponibili costi per il recupero di dati o metadati in queste classi prima della durata minima di archiviazione per la classe.

Per proteggere i dati in un bucket Cloud Storage da danni accidentali o dannosa, puoi utilizzare Eliminazione temporanea per conservare gli oggetti eliminati e sovrascritti per un periodo specificato e il Blocchi di oggetti per impedire l'eliminazione o l'aggiornamento degli oggetti.

Storage Transfer Service consente di importare i dati da Amazon S3, Archiviazione BLOB di Azure o dati on-premise in Cloud Storage. Negli scenari di RE, puoi utilizzare Storage Transfer Service per:

  • Esegui il backup dei dati di altri provider di archiviazione in un bucket Cloud Storage.
  • Spostare i dati da un bucket in una zona a due o più regioni a un bucket in un per ridurre i costi di archiviazione dei backup.

Filestore

Filestore Le istanze sono file server NFS completamente gestiti per l'utilizzo con applicazioni in esecuzione su istanze Compute Engine o cluster GKE.

I livelli Filestore Basic e Zonali sono risorse a livello di zona e non supporta la replica tra zone, mentre il livello Filestore Enterprise sono risorse di regione. Per aiutarti ad aumentare la resilienza del nell'ambiente Filestore, consigliamo di utilizzare istanze di livello Enterprise.

Google Kubernetes Engine

GKE è un ambiente gestito e pronto per la produzione per il deployment diverse applicazioni. GKE ti consente di orchestrare i sistemi ad alta disponibilità e include le seguenti funzionalità:

  • Riparazione automatica dei nodi. Se un nodo non supera controlli di integrità consecutivi per un periodo di tempo prolungato (circa 10 minuti), GKE avvia una riparazione processo per quel nodo.
  • Probe di attività e idoneità. Puoi specificare un probe di attività, che comunica periodicamente a GKE che il pod è in esecuzione. Se il pod ha errore un probe, può essere riavviato.
  • Cluster multizona e a livello di regione. Puoi distribuire le risorse Kubernetes su più zone all'interno di un regione.
  • Gateway multi-cluster consente di configurare risorse di bilanciamento del carico condivise tra più cluster GKE in diverse regioni.
  • Backup per GKE consente di eseguire il backup e il ripristino dei carichi di lavoro nei cluster GKE.

Networking e trasferimento di dati

La tabella seguente fornisce un riepilogo delle funzionalità dei servizi di networking e trasferimento di dati di Google Cloud che fungono da componenti di base per la RE:

Prodotto Funzionalità
Cloud Load Balancing
  • Controlli di integrità
  • Bilanciamento del carico globale
  • Bilanciamento del carico a livello di regione
  • Failover in più regioni
  • Bilanciamento del carico multiprotocollo
  • Bilanciamento del carico esterno ed interno
Cloud Service Mesh
  • Piano di controllo mesh di servizi gestito da Google
  • Routing delle richieste avanzato e criteri avanzati per il controllo del traffico
Cloud DNS
  • Gestione DNS programmatica
  • Controllo degli accessi
  • Anycast per gestire le zone
  • Criteri DNS
Cloud Interconnect
  • Cloud VPN (VPN IPsec)
  • Peering diretto

Cloud Load Balancing

Cloud Load Balancing offre alta disponibilità per i prodotti di computing di Google Cloud distribuendo e il traffico tra più istanze delle applicazioni. Puoi configurare Cloud Load Balancing con controlli di integrità che determinano se le istanze sono disponibili per lavorare in modo che il traffico non viene instradato a istanze con errori.

Cloud Load Balancing fornisce un singolo indirizzo IP anycast per le tue applicazioni. Le applicazioni possono avere istanze in esecuzione in diverse regioni (ad esempio, in Europa e negli Stati Uniti) gli utenti finali vengono indirizzati all'insieme di istanze più vicino. Oltre a che fornisce il bilanciamento del carico per i servizi esposti a internet, può configurare del carico interno per i tuoi servizi dietro un indirizzo IP privato di bilanciamento del carico. Questo IP è accessibile solo alle istanze VM interne al tuo Virtual Private Cloud (VPC).

Per ulteriori informazioni, vedi Panoramica di Cloud Load Balancing.

Cloud Service Mesh

Cloud Service Mesh è un mesh di servizi gestito da Google disponibile su Google Cloud. Cloud Service Mesh offre una telemetria approfondita per aiutarti a raccogliere e insight dettagliati sulle tue applicazioni. Supporta i servizi eseguiti su una diverse infrastrutture di computing.

Cloud Service Mesh supporta inoltre la gestione avanzata del traffico e come l'interruzione del circuito e la fault injection. Con circuito puoi imporre dei limiti sulle richieste a un particolare servizio. Quando vengono raggiunti i limiti di interruzione di circuito, le richieste vengono bloccate per evitare un ulteriore degrado del servizio. Con guasto un'iniezione, Cloud Service Mesh può introdurre ritardi o interrompere una frazione di richieste a un servizio. Fault injection consente di testare il servizio possibilità di sopravvivere a ritardi delle richieste o richieste interrotte.

Per ulteriori informazioni, vedi Panoramica di Cloud Service Mesh.

Cloud DNS

Cloud DNS offre un metodo programmatico per gestire le voci DNS come parte di un processo di recupero automatizzato. Cloud DNS utilizza la rete globale di Google Anycast server dei nomi per la gestione delle zone DNS da località ridondanti intorno al in tutto il mondo, offrendo disponibilità elevata e minore latenza ai tuoi utenti.

Se hai scelto di gestire le voci DNS on-premise, puoi abilitare le VM in a Google Cloud di risolvere questi indirizzi forwarding di Cloud DNS.

Cloud DNS supporta norme per configurare la modalità di risposta alle richieste DNS. Ad esempio, puoi configurare Criteri di routing DNS per indirizzare il traffico in base a criteri specifici, come abilitando il failover a una configurazione di backup per fornire disponibilità elevata, o per instradare le richieste DNS in base alla loro posizione geografica.

Cloud Interconnect

Cloud Interconnect offre modi per spostare informazioni da altre in Google Cloud. Parleremo di questo prodotto più avanti Trasferimento di dati da e verso Google Cloud.

Gestione e monitoraggio

La tabella seguente fornisce un riepilogo delle funzionalità dei servizi di gestione e monitoraggio di Google Cloud che fungono da componenti di base per il RE:

Prodotto Funzionalità
Dashboard dello stato di Cloud
  • Stato dei servizi Google Cloud
Google Cloud Observability
  • Monitoraggio del tempo di attività
  • Avvisi
  • Logging
  • Error Reporting
Google Cloud Managed Service per Prometheus
  • Soluzione Prometheus gestita da Google

Dashboard dello stato di Cloud

La Dashboard dello stato di Cloud mostra la disponibilità attuale dei servizi Google Cloud. Puoi visualizzare lo stato nella pagina e puoi iscriverti a un feed RSS che viene aggiornato ogni volta che ci sono notizie su un servizio.

Cloud Monitoring

Cloud Monitoring raccoglie metriche, eventi e metadati da Google Cloud, AWS, probe di uptime, strumentazione delle applicazioni e una serie di altre applicazioni componenti. Puoi configurare avvisi per inviare notifiche a strumenti di terze parti come Slack o Pagerduty, al fine di fornire aggiornamenti tempestivi Google Workspace for Education.

Cloud Monitoring consente di creare controlli di uptime endpoint disponibili pubblicamente e per all'interno dei tuoi VPC. Ad esempio, puoi monitorare URL, istanze Revisioni di Cloud Run e risorse di terze parti, come Amazon Elastic di Compute Cloud (EC2).

Google Cloud Managed Service per Prometheus

Google Cloud Managed Service per Prometheus è un servizio multi-cloud gestito da Google soluzione per le metriche di Prometheus. Consente di monitorare e inviare avvisi a livello globale carichi di lavoro, utilizzando Prometheus, senza dover gestire e far funzionare manualmente Prometheus su larga scala.

Per ulteriori informazioni, vedi Google Cloud Managed Service per Prometheus.

Componenti di base per RE multipiattaforma

Quando esegui carichi di lavoro su più piattaforme, in modo da ridurre l'overhead operativo consiste nel selezionare strumenti che funzionino con tutte le piattaforme che utilizzi. Questa sezione illustra alcuni strumenti e servizi indipendenti dalla piattaforma e che quindi supportano scenari di RE multipiattaforma.

Infrastructure as Code (IaC)

definendo la tua infrastruttura tramite codice, anziché interfacce grafiche puoi adottare strumenti per la creazione di modelli dichiarativi e automatizzare il provisioning e la configurazione dell'infrastruttura piattaforme di terze parti. Ad esempio, puoi utilizzare Terraform. e Infrastructure Manager per attivare la configurazione dichiarativa dell'infrastruttura.

Strumenti di gestione delle configurazioni

Per infrastrutture di RE di grandi dimensioni o complesse, consigliamo un'infrastruttura che non dipende dalla piattaforma di gestione di software come Chef e Ansible. Questi strumenti assicurano configurazioni riproducibili possono essere applicate indipendentemente da dove carico di lavoro.

Strumenti Orchestrator

I container possono anche essere considerati un componente di base per la RE. I container sono un modo per pacchettizzare servizi e introdurre coerenza tra le piattaforme.

Se lavori con i container, in genere utilizzi un agente di orchestrazione. Kubernetes non solo per gestire i container all'interno di Google Cloud (utilizzando GKE), ma consente di orchestrare i carichi di lavoro basati su container piattaforme di terze parti. Google Cloud, AWS e Microsoft Azure forniscono tutti versioni gestite di Kubernetes.

a distribuire il traffico ai cluster Kubernetes in esecuzione in diversi piattaforme, puoi utilizzare un servizio DNS che supporti record ponderati include il controllo di integrità.

Devi inoltre assicurarti di poter eseguire il pull dell'immagine nell'ambiente di destinazione. Questo significa che devi poter accedere al registro di immagini nell'evento di un disastro. Una buona opzione indipendente dalla piattaforma è: Artifact Registry.

Trasferimento dei dati

Il trasferimento di dati è un componente fondamentale degli scenari di RE multipiattaforma. Marca assicurati di progettare, implementare e testare i tuoi scenari di RE multipiattaforma utilizzando prototipi realistici di ciò che richiede lo scenario di trasferimento di dati di RE. Me gli scenari di trasferimento di dati nella prossima sezione.

Servizio di backup e RE

Il servizio di backup e RE è una soluzione di backup e RE per i carichi di lavoro cloud. Ti aiuta recuperare i dati e riprendere le operazioni aziendali critiche; inoltre, supporta diverse Prodotti Google Cloud e database di terze parti e archiviazione dati.

Per ulteriori informazioni, vedi Panoramica del servizio Backup & DR.

Modelli per RE

Questa sezione illustra alcuni dei pattern più comuni per le architetture di RE sulla base dei componenti di base di cui abbiamo parlato in precedenza.

Trasferimento di dati da e verso Google Cloud

Un aspetto importante del tuo piano di RE è la velocità di trasferimento dei dati da e verso Google Cloud. Ciò è fondamentale se il tuo piano di RE si basa su di dati da un ambiente on-premise a Google Cloud o da un altro a Google Cloud. Questa sezione illustra il networking Servizi Google Cloud in grado di garantire una buona velocità effettiva.

Quando utilizzi Google Cloud come sito di ripristino per i carichi di lavoro che sono on-premise o su un altro ambiente cloud, considera quanto segue elementi chiave:

  • Come puoi connetterti a Google Cloud?
  • Qual è la larghezza di banda tra te e il provider di interconnessione?
  • Qual è la larghezza di banda fornita dal provider direttamente a Google Cloud?
  • Quali altri dati verranno trasferiti usando questo collegamento?

Per saperne di più sul trasferimento di dati in Google Cloud, consulta Esegui la migrazione a Google Cloud: trasferisci set di dati di grandi dimensioni.

Bilanciamento della configurazione delle immagini e della velocità di deployment

Quando configuri un'immagine macchina per il deployment di nuove istanze, considera la l'effetto che la configurazione avrà sulla velocità del deployment. C'è un un compromesso tra la quantità di preconfigurazione delle immagini e i costi di mantenimento dell'immagine e la velocità di deployment. Ad esempio, se l'immagine di una macchina minimamente configurato, le istanze che la utilizzano richiedono più tempo perché devono scaricare e installare le dipendenze. Dall'altra parte Se l'immagine della macchina è altamente configurata, le istanze che la utilizzano ma devi aggiornare l'immagine più spesso. L'ora utilizzata per avviare un'istanza completamente operativa avrà una correlazione diretta il tuo RTO.

Diagramma che mostra 3 livelli di bundling (da non bundle a completamente in bundle) mappati rispetto al tempo di avvio dell'immagine (il più in bundle è il più veloce ad avvio)

Mantenimento della coerenza delle immagini delle macchine negli ambienti ibridi

Se implementi una soluzione ibrida (da on-premise a cloud o da cloud a cloud), devono trovare un modo per mantenere la coerenza delle immagini in tutti gli ambienti di produzione.

Se è richiesta un'immagine completamente configurata, considera ad esempio Packer che possono creare immagini macchina identiche per più piattaforme. Puoi utilizzare la modalità gli stessi script con file di configurazione specifici della piattaforma. Nel caso di Packer, puoi inserire il file di configurazione nel controllo della versione per la versione di cui viene eseguito il deployment in produzione.

In alternativa, puoi usare gli strumenti di gestione delle configurazioni come Chef, Puppet, Ansible o Saltstack per configurare le istanze con maggiore granularità, creando immagini di base, immagini minimamente configurate o immagini completamente configurate necessaria.

Puoi anche convertire e importare manualmente immagini esistenti come Amazon AMI, immagini Virtualbox e immagini disco RAW in Compute Engine.

Implementazione dell'archiviazione a più livelli

Il pattern di archiviazione a più livelli viene in genere utilizzato per i backup in cui il backup viene eseguito su uno spazio di archiviazione più veloce ed esegui lentamente la migrazione dei backup meno recenti di archiviazione a basso costo (ma lenta). Se applichi questo pattern, esegui la migrazione dei backup tra bucket di diverse classi di archiviazione, di solito Da standard a classi di archiviazione a costo inferiore, come Nearline e Coldline.

Per implementare questo pattern, puoi utilizzare Gestione del ciclo di vita degli oggetti. Ad esempio, puoi modificare automaticamente la classe di archiviazione degli oggetti più vecchi di un certo periodo di tempo a Coldline.

Passaggi successivi

Collaboratori

Autori: