Gestione delle repliche di lettura

In questa pagina viene descritto come gestire le repliche di lettura. Queste operazioni includono la disattivazione e l'abilitazione della replica, la promozione di una replica, la configurazione della replica parallela e il controllo dello stato della replica.

Per ulteriori informazioni su come funziona la replica, consulta Replica in Cloud SQL.

Disabilita replica

Per impostazione predefinita, una replica viene avviata con la replica abilitata. Tuttavia, puoi disabilitare la replica, ad esempio per eseguire il debug o analizzare lo stato di un'istanza. Quando è tutto pronto, riabilita la replica esplicitamente. La disattivazione o la riattivazione della replica non comporta il riavvio dell'istanza di replica.

La disabilitazione della replica non arresta la replica, ma diventa un'istanza di sola lettura che non viene più replicata dalla sua istanza principale. L'istanza continuerà a esserti addebitata. Sulla replica disabilitata, puoi riabilitare la replica, eliminarla o promuoverla a istanza standalone.

Per disabilitare la replica:

Console

  1. Nella console Google Cloud, vai alla pagina Istanze Cloud SQL.

    Vai a Istanze Cloud SQL

  2. Seleziona un'istanza di replica facendo clic sul suo nome.
  3. Fai clic su Disabilita replica nella barra dei pulsanti.
  4. Fai clic su Ok.

gcloud

gcloud sql instances patch REPLICA_NAME \
--no-enable-database-replication

REST v1

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:patch per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

PATCH https://sqladmin.googleapis.com/v1/projects/project-id/instances/replica-name

Corpo JSON della richiesta:

{
  "settings":
  {
    "databaseReplicationEnabled": "False"
  }
}

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

REST v1beta4

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:patch per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

PATCH https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name

Corpo JSON della richiesta:

{
  "settings":
  {
    "databaseReplicationEnabled": "False"
  }
}

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

Abilita replica

Se una replica non è stata replicata da molto tempo, impiegherà più tempo per raggiungere l'istanza principale. In questo caso, elimina la replica e creane una nuova.

Per abilitare la replica:

Console

  1. Nella console Google Cloud, vai alla pagina Istanze Cloud SQL.

    Vai a Istanze Cloud SQL

  2. Seleziona un'istanza di replica facendo clic sul suo nome.
  3. Fai clic su Abilita replica.
  4. Fai clic su Ok.

gcloud

gcloud sql instances patch REPLICA_NAME \
--enable-database-replication

REST v1

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:patch per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

PATCH https://sqladmin.googleapis.com/v1/projects/project-id/instances/replica-name

Corpo JSON della richiesta:

{
  "settings":
  {
    "databaseReplicationEnabled": "True"
  }
}

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

REST v1beta4

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:patch per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

PATCH https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name

Corpo JSON della richiesta:

{
  "settings":
  {
    "databaseReplicationEnabled": "True"
  }
}

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

Promuovi una replica

Con la promozione di una replica di lettura, la replica viene interrotta e l'istanza convertita in istanza autonoma di Cloud SQL principale con funzionalità di lettura e scrittura.

Una volta promosse, le repliche di lettura vengono configurate automaticamente con backup, ma non come istanze ad alta disponibilità (HA). Puoi abilitare l'alta disponibilità dopo aver promosso la replica come faresti per qualsiasi istanza non replica. La configurazione di una replica di lettura per l'alta disponibilità viene eseguita come per un'istanza principale. Scopri di più sulla configurazione dell'istanza per l'alta disponibilità.

Prima di promuovere una replica di lettura, se il client principale è ancora disponibile e gestisce i client, devi procedere nel seguente modo:

  1. Arresta tutte le scritture sull'istanza principale.
  2. Controlla lo stato di replica della replica (segui le istruzioni nella scheda psql Client).
  3. Verifica che la replica sia in fase di replica, quindi attendi che il tempo di replica riportato dalla metrica replay_lag sia pari a 0.

In caso contrario, un'istanza appena promossa potrebbe non contenere alcune transazioni impegnate per l'istanza principale.

Per promuovere una replica a istanza autonoma:

Console

  1. Nella console Google Cloud, vai alla pagina Istanze Cloud SQL.

    Vai a Istanze Cloud SQL

  2. Seleziona un'istanza di replica facendo clic sul suo nome.
  3. Fai clic su Promuovi replica.
  4. Fai clic su Ok.

gcloud

gcloud sql instances promote-replica REPLICA_NAME
  

REST v1

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:promoteReplica per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/v1/projects/project-id/instances/replica-name/promoteReplica

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

REST v1beta4

Per eseguire questo comando cURL al prompt della riga di comando, ottieni un token di accesso utilizzando il comando gcloud auth stampa-access-token. Puoi anche utilizzare Explorer API nella pagina Instances:promoteReplica per inviare la richiesta API REST.

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • project-id: l'ID progetto
  • replica-name: il nome dell'istanza di replica

Metodo HTTP e URL:

POST https://sqladmin.googleapis.com/sql/v1beta4/projects/project-id/instances/replica-name/promoteReplica

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

Verifica che l'istanza promossa sia configurata correttamente. In particolare, valuta la possibilità di configurare l'istanza per l'alta disponibilità, se necessario.

Controlla lo stato della replica

Quando visualizzi un'istanza di replica mediante la console Google Cloud o accedi all'istanza utilizzando un client di amministrazione, ottieni informazioni dettagliate sulla replica, tra cui stato e metriche. Quando utilizzi gcloud CLI, ricevi un breve riepilogo della configurazione della replica.

Prima di controllare lo stato della replica di un'istanza di replica Cloud SQL, utilizza il comando
gcloud sql instances describe per visualizzare lo stato dell'istanza. Di conseguenza, puoi vedere se la replica è abilitata per l'istanza di replica.

Le seguenti metriche sono disponibili per le istanze di replica. Scopri di più sulle metriche aggiuntive disponibili per tutte le istanze, incluse quelle non di replica.

MetricaDescrizione
Stato di replica
(cloudsql.googleapis.com/database/replication/state)

Indica se la replica sta trasmettendo flussi di log dall'istanza principale alla replica. I valori possibili sono:

  • Running
  • Stopped
  • Error

Questa metrica indica Running se:

  1. pg_catalog.pg_stat_wal_receiver segnala un status di "streaming" e
  2. pg_catalog.pg_is_wal_replay_paused() segnala "f" (false).

Per ulteriori informazioni, consulta The Statistics Collector e System Administration Functions nel manuale di riferimento PostgreSQL.

Ritardo della replica
(cloudsql.googleapis.com/database/replication/replica_lag)

Il periodo di tempo in cui lo stato della replica è in ritardo rispetto allo stato dell'istanza principale. Questa è la differenza tra (1) l'ora attuale e (2) il timestamp originale in cui l'istanza principale ha impegnato la transazione attualmente in corso di applicazione alla replica. In particolare, le scritture possono essere conteggiate come in ritardo anche se sono state ricevute dalla replica, se quest'ultima non ha ancora applicato la scrittura al database.

Per le repliche a cascata, ogni coppia di replica principale viene monitorata separatamente e non esiste un'unica metrica che genera il ritardo end-to-end (da principale a replica).

Per ulteriori informazioni, vedi Ritardo della replica.

Byte di ritardo
(cloudsql.googleapis.com/database/postgresql/replication/replica_byte_lag)

Segnala il numero di byte di ritardo rispetto alla replica di lettura principale da parte della replica di lettura. Per ogni replica vengono prodotte quattro serie temporali che mostrano il numero di byte nel log write-ahead dell'istanza principale che non sono stati ancora stati...

  • sent_location: ...inviato alla replica
  • write_location: ...scritto su disco dalla replica
  • flush_location: ... svuotato su disco dalla replica
  • replay_location: riprodotto dalla replica

Queste metriche hanno scopi diversi. Ad esempio, replay_location fornisce un'indicazione del ritardo della replica (il numero di transazioni impegnate nell'istanza principale che non sono ancora state applicate alla replica), mentre flush_location fornisce un'indicazione del numero di transazioni che non sono state registrate in modo duraturo sull'istanza di replica.

Queste metriche vengono calcolate confrontando pg_catalog.pg_current_wal_lsn() con uno dei seguenti campi da pg_stat_replication: sent_lsn, write_lsn, flush_lsn o replay_lsn. Per ulteriori informazioni, consulta The Statistics Collector nel manuale di riferimento PostgreSQL.

Byte di ritardo max
(cloudsql.googleapis.com/database/postgresql/external_sync/max_replica_byte_lag)

Per una replica di un'istanza principale esterna, segnala il ritardo di replica massimo (in byte) su tutti i database che vengono replicati in questa istanza. Per ogni database, questo valore è definito come il numero di byte nel log write-ahead dell'istanza principale che non è stata confermata la ricezione dalla replica.

Questa metrica viene calcolata inviando una query all'istanza principale per confrontare pg_catalog.pg_current_wal_lsn() con il valore confirmed_flush_lsn per ogni database che viene replicato in questa istanza di replica. Per ulteriori informazioni, consulta The Statistics Collector nel manuale di riferimento PostgreSQL.

Per controllare lo stato della replica:

Console

Cloud SQL segnala la metrica Replication State sulla dashboard di monitoraggio predefinita di Cloud SQL.

Per visualizzare altre metriche per le repliche all'interno o tra regioni e le repliche di server esterni, crea una dashboard personalizzata e aggiungi le metriche da monitorare:

  1. Nella console Google Cloud, vai alla pagina Monitoring.

    Vai a Monitoring

  2. Seleziona la scheda Dashboard.
  3. Fai clic su Crea dashboard.
  4. Assegna un nome alla dashboard e fai clic su OK.
  5. Fai clic su Aggiungi grafico.
  6. In Tipo di risorsa, seleziona Database Cloud SQL.
  7. Esegui una delle seguenti operazioni:
    1. Per monitorare la metrica dello stato di replica: nel campo Seleziona una metrica, digita Replication state. Quindi aggiungi un filtro per state = "Running". Il grafico mostra 1 se la replica è in esecuzione e 0 in caso contrario.
    2. Per monitorare il ritardo della replica, in byte, per una replica di lettura: nel campo Seleziona una metrica, digita Lag Bytes. Quindi, aggiungi un filtro per replica_lag_type = "replay_location". Il grafico mostra il numero di byte associati alle transazioni di cui è stato eseguito il commit nell'istanza principale, ma che non sono ancora stati riprodotti nella replica.
    3. Per monitorare il ritardo della replica, in byte, per una replica di un'istanza principale esterna: nel campo Seleziona una metrica, digita Max Lag Bytes. Il grafico mostra il numero di byte associati alle transazioni di cui è stato eseguito il commit nell'istanza principale, ma che non sono ancora stati confermati dalla replica.

gcloud

Per un'istanza di replica, controlla lo stato della replica con:

gcloud sql instances describe REPLICA_NAME

Nell'output, cerca le proprietà databaseReplicationEnabled e masterInstanceName.

Per un'istanza principale, controlla se esistono repliche con:

gcloud sql instances describe PRIMARY_INSTANCE_NAME

Nell'output, cerca la proprietà replicaNames.

Client psql

Alcune metriche dello stato della replica vengono prodotte dall'istanza principale, mentre altre dalla replica. Per i passaggi seguenti, connettiti alla replica o all'istanza principale (come indicato di seguito) con un client PostgreSQL.

Per informazioni, consulta le Opzioni di connessione per le applicazioni esterne.

  1. Per controllare lo stato della replica dall'istanza principale:
    select * from pg_stat_replication;
    Cerca le seguenti metriche nell'output del comando:
    • client_addr: l'indirizzo IP dell'istanza di replica.
    • state: indica se il thread SQL per l'esecuzione di eventi nel log di inoltro è in esecuzione. Il valore è streaming all'avvio della replica.
    • replay_lag: il numero di byte che il thread SQL di replica si trova dietro l'istanza principale. Il valore è O o un numero ridotto di byte.
  2. Per controllare lo stato della replica dall'istanza di replica:
    select * from pg_stat_wal_receiver;

    Cerca le seguenti metriche nell'output del comando:

    • sender_host: l'indirizzo IP dell'istanza principale.
    • status: indica se il thread SQL per l'esecuzione di eventi nel log di inoltro è in esecuzione. Il valore è streaming all'avvio della replica.
    • last_msg_send_time e last_msg_receipt_time: la differenza tra questi due timestamp è il tempo di attesa.

    Per verificare se la replica è stata messa in pausa:

    select pg_is_wal_replay_paused();

    Il valore è t se la replica è in pausa e f in caso contrario.

    Per verificare se ci sono transazioni ricevute dall'istanza principale, ma non ancora applicate:

    # for PostgreSQL 9.6
    select pg_catalog.pg_last_xlog_receive_location(), pg_catalog.pg_last_xlog_replay_location();
    # for PostgreSQL 10 and above
    select pg_catalog.pg_last_wal_receive_lsn(), pg_catalog.pg_last_wal_replay_lsn();

    Se i due valori sono uguali, la replica ha elaborato tutte le transazioni che ha ricevuto dall'istanza principale.

  • Per ulteriori dettagli sull'output di questi comandi, consulta la documentazione di PostgreSQL su The Statistics Collector.
  • Risolvere i problemi

    Problema Risoluzione dei problemi
    La replica di lettura non è stata avviata al momento della creazione. Probabilmente contiene un errore più specifico nei file di log. Esamina i log in Cloud Logging per trovare l'errore effettivo.
    Impossibile creare la replica di lettura: errore invalidFlagValue. Uno dei flag nella richiesta non è valido. Potrebbe essere un flag da te fornito esplicitamente o impostato su un valore predefinito.

    Innanzitutto, verifica che il valore del flag max_connections sia maggiore o uguale al valore del flag principale.

    Se il flag max_connections è impostato correttamente, controlla i log in Cloud Logging per individuare l'errore effettivo.

    Impossibile creare la replica di lettura: errore sconosciuto. Probabilmente contiene un errore più specifico nei file di log. Esamina i log in Cloud Logging per trovare l'errore effettivo.

    Se l'errore è: set Service Networking service account as servicenetworking.serviceAgent role on consumer project, disattiva e riattiva Service Networking API. Questa azione crea l'account di servizio necessario per continuare la procedura.

    Il disco è pieno. La dimensione del disco dell'istanza principale può diventare piena durante la creazione della replica. Modifica l'istanza principale per eseguirne l'upgrade a una dimensione del disco maggiore.
    Lo spazio su disco aumenta in modo significativo. Uno slot non utilizzato attivamente per monitorare i dati fa sì che PostgreSQL trattenga i segmenti WAL per un tempo indeterminato, con conseguente aumento dell'infinito dello spazio su disco. Se utilizzi le funzionalità di replica logica e decodifica in Cloud SQL, gli slot di replica vengono creati e eliminati automaticamente. Gli slot di replica inutilizzati possono essere rilevati eseguendo una query nella vista di sistema pg_replication_slots e filtrando la colonna active. Gli slot inutilizzati possono essere eliminati per rimuovere i segmenti WAL utilizzando il comando pg_drop_replication_slot.
    L'istanza di replica utilizza troppa memoria. La replica utilizza la memoria temporanea per memorizzare nella cache le operazioni di lettura richieste più spesso, il che può comportare l'utilizzo di più memoria rispetto all'istanza principale.

    Riavvia l'istanza di replica per recuperare lo spazio di memoria temporaneo.

    Replica interrotta. È stato raggiunto il limite massimo di spazio di archiviazione e l'aumento automatico dello spazio di archiviazione non è abilitato.

    Modifica l'istanza per abilitare automatic storage increase.

    Il ritardo della replica è costantemente elevato. Il carico di scrittura è troppo elevato per essere gestito dalla replica. Il ritardo della replica si verifica quando il thread SQL su una replica non è in grado di stare al passo con il thread di IO. Alcuni tipi di query o carichi di lavoro possono causare un ritardo di replica temporaneo o permanente elevato per uno schema specifico. Alcune delle cause tipiche del ritardo della replica sono:
    • Query lente sulla replica. Trovale e correggile.
    • Tutte le tabelle devono avere una chiave univoca/primaria. Ogni aggiornamento di una tabella di questo tipo senza una chiave univoca/primaria provoca scansioni complete della tabella nella replica.
    • Query come DELETE ... WHERE field < 50000000 causano un ritardo della replica con la replica basata su riga perché un numero enorme di aggiornamenti si accumula nella replica.

    Ecco alcune possibili soluzioni:

    • Modifica l'istanza per aumentare le dimensioni della replica.
    • Riduci il carico sul database.
    • Invia traffico di lettura alla replica di lettura.
    • Indicizza le tabelle.
    • Identifica e correggi le query di scrittura lente.
    • Ricrea la replica.
    Errori durante la ricreazione degli indici in PostgreSQL 9.6. PostgreSQL ti informa che devi ricreare un determinato indice. Questa operazione può essere eseguita solo sull'istanza principale. Se crei una nuova istanza di replica, a breve riceverai di nuovo lo stesso errore. Gli indici hash non vengono propagati alle repliche nelle versioni PostgreSQL precedenti alla 10.

    Se devi utilizzare indici hash, esegui l'upgrade a PostgreSQL 10 o versioni successive. In caso contrario, se vuoi utilizzare anche le repliche, non utilizzare gli indici hash in PostgreSQL 9.6.

    La query sull'istanza principale è sempre in esecuzione. Dopo aver creato una replica, è previsto che la query SELECT * from pg_stat_activity where state = 'active' and pid = XXXX and username = 'cloudsqlreplica' venga eseguita continuativamente sull'istanza principale.
    La creazione della replica non riesce con il timeout. Le transazioni non impegnate a lunga esecuzione sull'istanza principale possono causare un errore nella creazione della replica di lettura.

    Ricrea la replica dopo aver interrotto tutte le query in esecuzione.

    Se l'istanza principale e la replica hanno dimensioni vCPU diverse, potrebbero verificarsi problemi di prestazioni delle query, poiché lo strumento di ottimizzazione delle query prende in considerazione le dimensioni delle vCPU.

    Per risolvere il problema, completa i seguenti passaggi:

    1. Attiva il flag log_duration e imposta il parametro log_statement su ddl. In questo modo ottieni sia le query sia il tempo di esecuzione sul database. Tuttavia, a seconda del carico di lavoro, potrebbero verificarsi problemi di prestazioni.
    2. Sia nell'istanza principale che nella replica di lettura, esegui explain analyze per le query.
    3. Confronta il piano di query e verifica la presenza di differenze.

    Se si tratta di una query specifica, modificala. Ad esempio, puoi modificare l'ordine dei join per vedere se il rendimento migliora.

    Passaggi successivi