Informazioni sull'alta disponibilità

Questa pagina offre una panoramica della configurazione ad alta disponibilità (HA) per le istanze Cloud SQL. Per configurare una nuova istanza per l'alta disponibilità o per abilitare l'alta disponibilità su un'istanza esistente, consulta Abilitazione e disabilitazione dell'alta disponibilità su un'istanza.

Panoramica della configurazione ad alta disponibilità

Lo scopo di una configurazione ad alta disponibilità è ridurre i tempi di inattività quando una zona o un'istanza diventa non disponibile. Questo può accadere durante un'interruzione di zona o in caso di problema dell'hardware. Con l'alta disponibilità, i dati continuano a essere disponibili per le applicazioni client.

La configurazione ad alta disponibilità fornisce ridondanza dei dati. Un'istanza Cloud SQL configurata per l'alta disponibilità viene chiamata anche istanza a livello di regione e ha una zona principale e una secondaria all'interno della regione configurata. All'interno di un'istanza a livello di regione, la configurazione è composta da un'istanza principale e un'istanza in standby. Tramite la replica sincrona sul disco permanente di ogni zona, tutte le scritture effettuate nell'istanza principale vengono replicate sui dischi di entrambe le zone prima che venga segnalato il commit di una transazione. In caso di errore di un'istanza o di una zona, l'istanza in standby diventa la nuova istanza principale. Gli utenti vengono quindi reindirizzati alla nuova istanza principale. Questo processo è chiamato failover.

Dopo un failover, l'istanza che ha ricevuto il failover continua a essere quella principale anche dopo che l'istanza originale è tornata online. Una volta che la zona o l'istanza che ha subito un'interruzione torna disponibile, l'istanza principale originale viene eliminata e ricreata. Poi diventa la nuova istanza in standby. In caso di un failover futuro, il failover della nuova istanza principale verrà eseguita sull'istanza originale nella zona originale.

Se è necessario che l'istanza principale si trovi nella zona in cui si è verificata l'interruzione, puoi eseguire un errore. Un failover esegue gli stessi passaggi del failover, ma solo nella direzione opposta, per reindirizzare il traffico all'istanza originale. Per eseguire un failover, utilizza la procedura descritta in Avvio del failover.

Il supporto dei disco permanente a livello di regione per la configurazione ad alta disponibilità di Cloud SQL con almeno una CPU dedicata ha una copertura completa dell'accordo sul livello del servizio (SLA). Un'istanza configurata ad alta disponibilità costa il doppio di un'istanza autonoma. Questo prezzo include CPU, RAM e spazio di archiviazione. Per ulteriori informazioni, consulta la pagina dei prezzi.

Panoramica del diagramma della configurazione ad alta disponibilità di Cloud SQL. Descrivi il testo qui sotto.

Repliche di lettura

Se la disponibilità è un fattore importante per le repliche di lettura, puoi abilitare l'alta disponibilità sulle repliche. Quando promuovi una replica di questo tipo in modo che diventi un'istanza principale, questa è già configurata come istanza ad alta disponibilità.

Durante un'interruzione a livello di zona, il traffico si interrompe per leggere le repliche in quella zona. Quando la zona diventa di nuovo disponibile, eventuali repliche di lettura nella zona ripristinano la replica dall'istanza principale. Se le repliche di lettura non si trovano in una zona su cui si sta verificando un'interruzione, si connettono all'istanza in standby quando diventa l'istanza principale.

Come best practice, valuta la possibilità di posizionare alcune delle tue repliche di lettura in una zona diversa da quella delle istanze principali e di standby. Ad esempio, se hai un'istanza principale nella zona A e un'istanza in standby nella zona B, imposta una replica di lettura nella zona C per migliorare l'affidabilità. Questa pratica garantisce che le repliche di lettura continuino a funzionare anche se la zona dell'istanza principale non funziona. Devi inoltre aggiungere la logica di business nell'applicazione client per inviare letture all'istanza principale quando le repliche di lettura non sono disponibili.

Nota:l'istanza in standby non può essere utilizzata per le query di lettura. È diversa dalla configurazione ad alta disponibilità legacy di Cloud SQL per MySQL.

Panoramica del failover

Se un'istanza configurata ad alta disponibilità non risponde, Cloud SQL passa automaticamente alla gestione dei dati dall'istanza in standby. Per verificare se si è verificato un failover, controlla la cronologia di failover del log delle operazioni.

Scopri di più su come creare query in Esplora log. Se hai bisogno di informazioni più dettagliate su un'operazione, ad esempio l'utente che l'ha eseguita, devi abilitare l'audit logging.

Fai clic sulle schede per vedere in che modo il failover influisce sull'istanza.

Normale

Diagramma dell'istanza in stato integro prima del failover

Esegui il failover

Diagramma dell'istanza in caso di failover

Dopo il failover

Diagramma dell'istanza dopo il failover

Failback

Diagramma dell'istanza dopo il failover

Processo

Si verifica il seguente processo:

  • Errore durante l'istanza o la zona principale.

    Ogni secondo, il sistema heartbeat rileva se l'istanza principale è integro. Se non vengono rilevati più heartbeat, viene avviato il failover.

  • L'istanza in standby ora elabora i dati al momento della riconnessione.

    Tramite un indirizzo IP statico condiviso con l'istanza principale, l'istanza in standby ora gestisce i dati della zona secondaria.

Requisiti

Affinché Cloud SQL consenta un failover, la configurazione deve soddisfare i seguenti requisiti:

  • L'istanza principale deve essere in un normale stato operativo (non arrestata, in corso di manutenzione o esegue un'operazione di istanza Cloud SQL a lunga esecuzione, ad esempio un'operazione di backup).
  • La zona secondaria e l'istanza standby devono essere in stato integro. Quando l'istanza in standby non risponde, le operazioni di failover vengono bloccate. Dopo che Cloud SQL ha riparato l'istanza in standby e la zona secondaria è disponibile, Cloud SQL consente il failover.

Backup e ripristino

I backup automatici e il recupero point-in-time devono essere abilitati per le istanze ad alta disponibilità, escluse le repliche di lettura.

Applicazioni e istanze

Non esiste alcuna differenza nell'utilizzo delle istanze ad alta disponibilità e non, quindi la tua applicazione non deve essere configurata in alcun modo particolare. Quando si verifica il failover, tutte le connessioni esistenti all'istanza principale e le repliche di lettura vengono chiuse e il ripristino delle connessioni all'istanza principale richiede circa 60 secondi. L'applicazione si riconnette utilizzando la stessa stringa di connessione o lo stesso indirizzo IP, quindi non è necessario aggiornare l'applicazione dopo il failover.

Per vedere esattamente in che modo le applicazioni sono interessate dal failover, avvia manualmente il failover.

Tempo di inattività per la manutenzione

Gli eventi di manutenzione interessano le istanze principali configurate con alta disponibilità, come le altre istanze. È possibile che le istanze principali rimangano inattive per un breve periodo di tempo. Per ulteriori informazioni su come la manutenzione influisce sulle istanze ad alta disponibilità, consulta Come funziona la manutenzione. Per ridurre al minimo l'impatto sul servizio, modifica le impostazioni di manutenzione per controllare quando si verifica il tempo di inattività.

Prestazioni

Le prestazioni disco permanente a livello di regione dipendono da molti fattori. Le operazioni di I/O al secondo (IOPS) potrebbero essere ridotte con un disco permanente a livello di regione rispetto al disco permanente a livello di zona. Controlla la dimensione del tipo di istanza VM e l'input e l'output del carico di lavoro. Un'altra metrica da notare è che la latenza per i dischi permanenti a livello di regione con unità a stato solido (SSD) è superiore a quella per un disco permanente a livello di zona con SSD. Ciò implica che, se il carico di lavoro non è un carico di lavoro in modalità flusso ed è sensibile alla latenza, non può raggiungere il limite di IOPS poiché un disco permanente a livello di regione con SSD ha una latenza maggiore rispetto a un disco permanente a livello di zona con SSD. Ciò è dovuto alla replica sincrona dei dati tra più zone coinvolte in un disco permanente a livello di regione per fornire più copie dei dati nelle zone di una regione.

Opzione legacy per l'alta disponibilità di MySQL

Il processo legacy per l'aggiunta di alta disponibilità alle istanze MySQL utilizza una replica di failover. La funzionalità legacy non è disponibile nella console Google Cloud. Consulta Configurazione precedente: creazione di una nuova istanza configurata per l'alta disponibilità o Configurazione precedente: configurazione di un'istanza esistente per l'alta disponibilità.

Passaggi successivi