Utilizza il ripristino di emergenza (RE) avanzato

Questa pagina descrive come utilizzare il ripristino di emergenza (RE) avanzato. Il DR avanzato offre due funzionalità principali:

  • Il failover della replica consente di eseguire il failover dell'istanza principale alla replica di RE immediatamente in caso di guasto regionale. Per Cloud SQL per SQL Server, la replica di RE è una replica a cascata.
  • Il cambio ti consente di invertire i ruoli dell'istanza principale e di una replica di RE senza perdita di dati. Puoi utilizzare lo switchover per ripristinare lo stato di deployment originale di un deployment dopo il failover della replica oppure per testare il RE.

Il DR avanzato è supportato solo nelle istanze della versione Cloud SQL Enterprise Plus.

Prima di iniziare

Se prevedi di utilizzare Google Cloud SDK, devi utilizzare la versione 502.0.0 o successiva. Per controllare la versione dell'Google Cloud SDK, esegui gcloud --version. Per aggiornare l'Google Cloud SDK, esegui gcloud components update.

Per installare Google Cloud SDK, consulta Installa Google Cloud CLI.

Crea una replica RE

Prima di utilizzare RE avanzato, crea una replica a cascata dell'istanza principale in una regione diversa da quella dell'istanza principale.

Eseguire uno switchover

Dopo aver creato una replica di RE, puoi eseguire l'operazione di switchover. Tuttavia, come best practice, evita di eseguire l'operazione di passaggio nelle seguenti circostanze:

  • L'istanza principale è in uso attivo.
  • Sono in corso operazioni di amministrazione, come il backup automatico o l'attivazione o la disattivazione dell'alta disponibilità (HA).

Per evitare un timeout, valuta la possibilità di eseguire il passaggio quando il volume delle transazioni è ridotto.

Al termine dello switchover, l'operazione esegue il backup della nuova istanza principale (l'ex replica RE) non appena viene promossa. Al termine del backup, il recupero point-in-time (PITR) viene attivato completamente sulla nuova istanza principale. Il completamento del backup può richiedere da 5 a 15 minuti, a seconda delle dimensioni del disco. La copertura PITR inizia solo al termine di questo backup. Per ulteriori informazioni sulle considerazioni relative all'utilizzo del PITR con RE avanzato, consulta Utilizzare il PITR con il DR avanzato.

Al termine dell'operazione di switchover, noterai che la direzione della replica è invertita.

Dopo che la vecchia istanza principale è stata riconfigurata come replica di lettura, l'endpoint di scrittura DNS, che in precedenza risolveva nella vecchia istanza principale, risolve nella nuova istanza principale.

Prima di iniziare

Prima di eseguire l'operazione di passaggio, segui questi passaggi:

  • Se non l'hai ancora fatto, crea una RE DR.
  • Verifica che l'istanza principale e la replica di RE siano online.
  • Se utilizzi un endpoint di scrittura DNS, verifica che la configurazione SSL per l'istanza principale e la replica di RE sia la stessa. Ad esempio, se la replica di RE è configurata per applicare la crittografia SSL, ma l'istanza principale consente connessioni non criptate, i client non potranno connettersi alla nuova istanza principale al termine dell'operazione di switchover.
  • Esegui un backup on demand dell'istanza principale. Questo backup è una misura di sicurezza nel caso in cui tu debba recuperare da eventuali errori imprevisti.

Esegui l'operazione di switchover

gcloud

Per eseguire l'operazione di passaggio, esegui il seguente comando:

gcloud sql instances switchover REPLICA_NAME

Sostituisci le seguenti variabili:

  • REPLICA_NAME: il nome della replica di RE con cui vuoi che l'istanza principale cambi ruolo.

REST v1

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
  • REPLICA_NAME: il nome della replica RE.

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/REPLICA_NAME/switchover

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

REST v1beta4

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
  • REPLICA_NAME: il nome della replica RE.

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_NAME/switchover

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

Esegui il DR richiamando un failover della replica

In caso di guasto regionale o di emergenza, puoi eseguire RE invocando un'operazione di failover della replica alla replica di RE designata. Per eseguire un failover della replica, promuovi la replica RE. A differenza del passaggio, la promozione della replica di RE è immediata.

Poiché la replica di RE assume immediatamente il ruolo dell'istanza principale, è possibile che la replica non disponga di tutti i dati dell'istanza principale precedente a causa del ritardo della replica. Per questo motivo, un failover della replica può comportare la perdita di dati.

Nell'ambito del processo di promozione, il failover della replica esegue il backup della nuova istanza principale (l'ex replica RE) subito dopo che la replica RE diventa la nuova istanza principale. Al termine del backup, il recupero point-in-time (PITR) è completamente abilitato nella nuova istanza principale. Il completamento di questo backup può richiedere da 5 a 15 minuti, a seconda delle dimensioni del disco della nuova (e della vecchia) istanza principale. Durante questo periodo di backup, la funzionalità PITR non è disponibile.

Quando la vecchia istanza principale torna online, il processo di failover della replica esegue un backup. Dopo aver eseguito il backup, la vecchia istanza principale viene rielaborata come replica di lettura della nuova istanza principale.

Per ulteriori informazioni sulle considerazioni relative all'utilizzo del PITR con RE avanzato, consulta Utilizzare il PITR con il DR avanzato.

Dopo aver invocato l'operazione di failover della replica, l'endpoint di scrittura DNS, che in precedenza risolveva nella vecchia istanza principale, si risolve nella nuova istanza principale.

Prima di iniziare

Prima di poter eseguire un failover della replica, segui questi passaggi:

  • Se non l'hai ancora fatto, crea una RE DR.
  • Assicurati che la replica di RE sia online e funzionante.

Esegui l'operazione di failover della replica

gcloud

Per invocare un failover della replica alla replica di RE, utilizza il seguente comando:

gcloud sql instances promote-replica \
   REPLICA_NAME --failover

Sostituisci la seguente variabile:

  • REPLICA_NAME: il nome della replica RE

REST v1

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
  • REPLICA_NAME: il nome della replica RE.
  • ENABLE_REPLICA_FAILOVER: impostato su true per utilizzare il failover della replica. Se imposti il valore false, l'API utilizza il metodo promoteReplica normale senza il failover della replica.

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/REPLICA_NAME/promoteReplica?failover=ENABLE_REPLICA_FAILOVER

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

REST v1beta4

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
  • REPLICA_NAME: il nome della replica RE.
  • ENABLE_REPLICA_FAILOVER: impostato su true per utilizzare il failover della replica. Se imposti il valore false, l'API utilizza il metodo promoteReplica normale senza il failover della replica.

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_NAME/promoteReplica?failover=ENABLE_REPLICA_FAILOVER

Per inviare la richiesta, espandi una di queste opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

Controllare lo stato del failover di una replica

Il failover della replica avviene in due fasi. La prima fase è la promozione della replica RE. La seconda fase consiste nella ricreazione della vecchia istanza principale come replica di lettura.

Per controllare lo stato del failover della replica, controlla lo stato di ogni fase.

  1. Controlla lo stato della prima fase.

    Console

    Per verificare se la replica di RE è stata promossa a un'istanza autonoma:

    1. Nella console Google Cloud, vai alla pagina Istanze Cloud SQL.

      Vai a Istanze Cloud SQL

    2. Trova il nome della replica RE che hai promosso.
    3. Verifica che SQL Server VERSION sia visualizzato nella colonna Tipo per la nuova istanza principale.

    gcloud

    Per controllare lo stato, esegui il seguente comando:

    gcloud sql instances describe DR_REPLICA_NAME

    Sostituisci la seguente variabile:

    • DR_REPLICA_NAME: il nome della replica RE promossa

    Nell'output, verifica che venga visualizzato il seguente campo e che la replica sia diventata un'istanza principale Cloud SQL autonoma:

    instanceType: CLOUD_SQL_INSTANCE
    

  2. Per verificare il completamento della seconda fase, controlla il messaggio RECONFIGURE_OLD_PRIMARY nel log delle operazioni dell'istanza.

    La visualizzazione di questo messaggio dipende da quando la vecchia istanza principale torna online, il che può richiedere minuti o giorni in caso di incidente.

    Per ulteriori informazioni su come controllare i log delle operazioni in un'istanza, vedi Visualizzare i log dell'istanza.

Utilizzare il recupero point-in-time con RE avanzato

Sia con lo switchover sia con il failover della replica, non appena la replica di RE viene promossa a istanza principale, vengono apportate le seguenti modifiche per supportare il backup e il PITR:

  • La configurazione del backup, inclusa la pianificazione dei backup automatici, viene copiata dall'istanza principale precedente a quella nuova.
  • Viene eseguito un nuovo backup per supportare il PITR sulla nuova istanza principale.

  • Il criterio di conservazione dei log delle transazioni viene copiato dall'istanza principale precedente all'istanza principale nuova.

Sia per la configurazione del backup sia per i criteri di conservazione dei log delle transazioni, consigliamo di verificare che le impostazioni ereditate dalla vecchia istanza principale siano corrette per la nuova istanza principale.

Inizio della copertura PITR

Al termine dell'operazione di switchover, Cloud SQL pianifica i backup automatici e esegue il primo backup della nuova istanza principale. Se vuoi che la copertura PITR inizi il prima possibile, ti consigliamo di verificare che il primo backup sia stato eseguito correttamente. L'istanza principale appena promossa ha la copertura PITR solo dopo che il primo backup automatico è stato completato correttamente.

Per ulteriori informazioni su come visualizzare i backup disponibili per un'istanza, consulta Visualizzare un elenco di backup.

Copertura PITR per le istanze durante il cambio e il failover della replica

Quando un'istanza partecipa a un cambio o a un'operazione di failover della replica, l'istanza trascorre del tempo come replica di lettura. Il PITR e il ripristino di un backup sono supportati durante il periodo di tempo in cui l'istanza viene utilizzata come replica di lettura e come istanza principale.

Puoi eseguire il ripristino dei dati a un momento precedente al passaggio quando l'istanza era primaria. Per le operazioni di switchover e failover della replica, Cloud SQL avvia un backup secondo il criterio del massimo impegno per la nuova istanza principale non appena questa viene promossa. Il PITR viene attivato sull'istanza promossa solo al termine di questo backup. Il completamento del backup può richiedere da 5 a 15 minuti, a seconda delle dimensioni del disco.

Stato di split-brain durante il failover della replica

È possibile che si verifichi la situazione di split-brain quando l'istanza principale continua ad accettare le scritture mentre una replica viene promossa utilizzando il failover della replica. Dopo la promozione della replica, quando la vecchia istanza principale è di nuovo disponibile, viene ricostruita come replica dell'istanza promossa e viene eseguito un backup finale. Questo backup può essere utilizzato per recuperare eventuali dati con problemi di coerenza che non sono stati scritti nella replica promossa.

Eliminazione di backup e log delle transazioni sulle repliche

Se un'istanza principale abilitata con PITR e i backup diventa una replica di lettura, l'ultimo backup e il criterio di conservazione PITR dal momento in cui era un'istanza principale vengono conservati e applicati durante il periodo in cui è una replica. Anche se la nuova istanza principale non esegue i backup, i vecchi backup e i log delle transazioni utilizzati per il PITR vengono eliminati nella replica di lettura in base all'ultimo criterio configurato.

Ad esempio, se l'istanza è configurata per avere backup automatici giornalieri e conservare 7 backup con 7 giorni di log PITR, quando questa istanza diventa una replica di lettura, tutti gli elementi precedenti a 7 giorni vengono eliminati una volta al giorno.

Se hai bisogno di eliminare i backup prima, puoi rimuoverli manualmente. Per maggiori informazioni, consulta Eliminare un backup.

Limitazioni

  • Non puoi utilizzare la console Google Cloud per eseguire operazioni di failover o switchover della replica.

Risoluzione dei problemi

Problema Risoluzione dei problemi
L'operazione di switchover non è riuscita.
    Assicurati che l'istanza soddisfi tutti i requisiti della replica di RE(replica con struttura a cascata) dichiarati.
  • Controlla il volume delle transazioni nel database. Se il volume delle transazioni è elevato, l'operazione potrebbe scadere. Valuta la possibilità di riprovare l'operazione quando il carico delle transazioni è inferiore.
L'operazione di switchover non è riuscita e l'istanza principale è bloccata in modalità di sola lettura. Esegui un riavvio del database per ripristinare la modalità di scrittura dell'istanza principale.
L'operazione di switchover è stata completata, ma la console Google Cloud non mostra i nuovi ruoli invertiti per le istanze. Aggiorna il browser per visualizzare la topologia aggiornata.
L'operazione di failover della replica non è riuscita.
  • Assicurati di aver creato una replica RE per l'istanza principale e che la replica RE sia online.
  • Se il failover alla replica di RE non è riuscito, esegui la promozione a una replica di lettura normale (non RE).

Passaggi successivi