Le incoerenze negli indici del database possono verificarsi per diversi motivi, tra cui difetti del software, problemi hardware o modifiche di comportamento sottostanti, come le modifiche all'ordine di ordinamento.
La community PostgreSQL ha creato strumenti per identificare e risolvere questi problemi.
Sono inclusi strumenti come amcheck
,
che è consigliato dalla community PostgreSQL per identificare i problemi di coerenza,
inclusi i problemi riscontrati nelle versioni precedenti di PostgreSQL 14.
Abbiamo scritto questo playbook come riferimento per gli utenti di AlloyDB per PostgreSQL che riscontrano questi problemi. Ci auguriamo che questa pagina fornisca informazioni che possano essere utili anche ad altri utenti PostgreSQL per identificare e correggere gli indici B-tree incoerenti. Il nostro obiettivo è migliorare continuamente questo documento come risorsa per la più ampia community open source. Se hai un feedback, utilizza il pulsante Invia feedback nella parte superiore e inferiore di questa pagina.
Per risolvere le incoerenze di un indice, segui questi passaggi:
-
Prima di iniziare a eseguire l'indicizzazione nuovamente, devi eseguire il backup del database, impostare le autorizzazioni corrette, verificare la versione del client
psql
e attivare l'estensioneamcheck
. Verifica la presenza di indici B-tree incoerenti.
Per identificare gli indici per i quali devi correggere le incoerenze, devi identificare tutti gli indici B-tree con incoerenze e tutte le violazioni delle chiavi univoche e principali.
Correggi le incoerenze dell'indice.
La ricorsione di un indice corregge tutte le sue incoerenze. Potresti dover modificare le impostazioni di memoria dell'istanza per migliorare le prestazioni.
Monitora le operazioni di indicizzazione nuova.
Ti consigliamo di monitorare l'avanzamento dell'operazione di indicizzazione per verificare che stia procedendo e non sia bloccata.
Verifica che gli indici siano coerenti.
Dopo aver indicizzato correttamente l'indice, ti consigliamo di verificare che non contenga incoerenze.
Prima di iniziare
Esegui il backup dei dati del cluster AlloyDB
Per assicurarti che non vengano persi dati durante la reindicizzazione, ti consigliamo di eseguire il backup degli stessi. Per ulteriori informazioni, vedi Creare un backup on demand.
Imposta l'autorizzazione alloydbsuperuser
Per completare i passaggi in questa pagina, devi disporre delle autorizzazioni alloydbsuperuser
. Per ulteriori informazioni, consulta la sezione Ruoli PostgreSQL predefiniti di AlloyDB.
Assicurati che la versione del client psql
sia 9.6 o successiva
Per completare i passaggi in questa pagina, devi assicurarti che la versione del client psql
sia 9.6 o successiva. Esegui il comando psql --version
per verificare la versione corrente del client psql
.
Attivare l'estensione amcheck
Per verificare la presenza di incoerenze nell'indice, devi attivare l'estensione amcheck
.
Esempio di codice
CREATE EXTENSION amcheck;
Verifica la presenza di indici B-tree incoerenti
Le seguenti sezioni descrivono come verificare la presenza di indici B-tree incoerenti controllando le incoerenze di un indice, nonché le violazioni delle chiavi univoche e primarie.
Verificare la presenza di incoerenze
Esegui la seguente istruzione in ogni database per verificare la presenza di incoerenze in tutti gli indici B-tree:
Esempio di codice
DO $$ DECLARE r RECORD; version varchar(100); BEGIN RAISE NOTICE 'Started amcheck on database: %', current_database(); SHOW server_version into version; SELECT split_part(version, '.', 1) into version; FOR r IN SELECT c.oid, c.oid::regclass relname, i.indisunique FROM pg_index i JOIN pg_opclass op ON i.indclass[0] = op.oid JOIN pg_am am ON op.opcmethod = am.oid JOIN pg_class c ON i.indexrelid = c.oid JOIN pg_namespace n ON c.relnamespace = n.oid WHERE am.amname = 'btree' AND c.relpersistence != 't' AND c.relkind = 'i' AND i.indisready AND i.indisvalid LOOP BEGIN RAISE NOTICE 'Checking index %:', r.relname; PERFORM bt_index_check(index => r.oid, heapallindexed => r.indisunique); EXCEPTION WHEN undefined_function THEN RAISE EXCEPTION 'Failed to find the amcheck extension'; WHEN OTHERS THEN RAISE LOG 'Failed to check index %: %', r.relname, sqlerrm; RAISE WARNING 'Failed to check index %: %', r.relname, sqlerrm; END; END LOOP; RAISE NOTICE 'Finished amcheck on database: %', current_database(); END $$;
Dovresti visualizzare un output simile al seguente:
Esempio di codice
NOTICE: Checking index t_pkey: NOTICE: Checking index t_i_key: WARNING: Failed to check index t_i_key: item order invariant violated for index "t_i_key" NOTICE: Checking index t_j_key: WARNING: Failed to check index t_j_key: item order invariant violated for index "t_j_key" NOTICE: Checking index ij: WARNING: Failed to check index ij: item order invariant violated for index "ij"
Per ulteriori informazioni sulla visualizzazione dei log, consulta Visualizzare i log utilizzando Esplora log.
Identificare e correggere le violazioni delle chiavi univoche e primarie
Questa sezione descrive come controllare l'indice per verificare la presenza di violazioni delle chiavi univoche e principali e, se esistono, come correggerle.
Identificare violazioni delle chiavi univoche
Le violazioni delle chiavi univoche devono essere corrette prima di eseguire nuovamente l'indicizzazione di un indice. Per verificare tutte le violazioni delle chiavi univoche, esegui il seguente comando in ogni database:
Esempio di codice
WITH q AS ( /* this gets info for all UNIQUE indexes */ SELECT indexrelid::regclass as idxname, indrelid::regclass as tblname, indcollation, pg_get_indexdef(indexrelid), format('(%s)',(select string_agg(quote_ident(attname), ', ') from pg_attribute a join unnest(indkey) ia(nr) on ia.nr = a.attnum where attrelid = indrelid)) as idxfields, COALESCE(substring(pg_get_indexdef(indexrelid) FROM '[)] (WHERE .*)$'), '') as whereclause FROM pg_index WHERE indisunique /* next line excludes indexes not affected by collation changes */ AND trim(replace(indcollation::text, '0', '')) != '' ) SELECT /* the format constructs the query to execute for each index */ format( $sql$ DO $$ BEGIN RAISE NOTICE 'checking index %3$I%2$I on table %1$I %4$I'; END;$$; SELECT this, prev, /* we detect both reversed ordering or just not unique */ (CASE WHEN this = prev THEN 'DUPLICATE' ELSE 'BACKWARDS' END) as violation_type FROM (SELECT %2$s AS this, lag(%2$s) OVER (ORDER BY %2$s) AS prev FROM %1$s %4$s ) s WHERE this <= prev and this IS NOT NULL and prev IS NOT NULL; /* change to just '<' if looking for reverse order in index */ $sql$, tblname, idxfields, idxname, whereclause ) FROM q -- LIMIT 20 /* may use limit for testing */ -- the next line tells psql to executes this query and then execute each returned line separately \gexec
L'output dello script è simile al seguente:
Output
NOTICE: checking index=users_email_key on table=users key_columns="(email)" NOTICE: checking index=games_title_key on table=games key_columns="(title)" this | prev | violation_type --------------------+--------------------+---------------- Game #16 $soccer 2 | Game #16 $soccer 2 | DUPLICATE Game #18 $soccer 2 | Game #18 $soccer 2 | DUPLICATE Game #2 $soccer 2 | Game #2 $soccer 2 | DUPLICATE Game #5 $soccer 2 | Game #5 $soccer 2 | DUPLICATE
In questo output, l'intestazione della tabella NOTICE
mostra l'indice, la colonna e la tabella per i valori visualizzati sotto. Se l'output contiene righe che mostrano DUPLICATE
o BACKWARDS
, significa che l'indice è danneggiato e potrebbe essere necessario correggerlo. Le righe con BACKWARDS
indicano possibili valori duplicati che potrebbero essere nascosti. Se nella tabella sono presenti una di queste voci, consulta la sezione Correggere le violazioni delle chiavi duplicate.
Correggere le violazioni delle chiavi duplicate
Se hai identificato un indice univoco duplicato o se un'operazione di indicizzazione non riesce a causa di un errore di violazione di chiavi duplicate, completa i passaggi che seguono per trovare e rimuovere le chiavi duplicate.
Estrai
key_columns
dall'intestazione della tabellaNOTICE
, come mostrato nell'output di esempio precedente. Nell'esempio seguente, la colonna chiave èemail
.Output
NOTICE: checking index=users_email_key on table=users key_columns="(email)"
Utilizza questi valori in KEY_COLUMNS nella query del passaggio 3.
Trova lo schema della tabella. Utilizza
psql
per connetterti al database ed esegui il seguente comando:Esempio di codice
Il valore nella colonna\dt TABLE_NAME
schema
è il valore che utilizzi per SCHEMA_NAME nella query del passaggio 3.Ad esempio, per la seguente query:
\dt games
L'output è simile al seguente:
List of relations Schema | Name | Type | Owner --------+-------+-------+---------- public | games | table | postgres (1 row)
Esegui le seguenti istruzioni per forzare una scansione completa della tabella e ottenere chiavi duplicate.
Esempio di codice
SET enable_indexscan = off; SET enable_bitmapscan = off; SET enable_indexonlyscan = off; SELECT KEY_COLUMNS, count(*) FROM SCHEMA_NAME.TABLE_NAME GROUP BY KEY_COLUMNS HAVING count(*) > 1;
Nell'istruzione precedente, KEY_COLUMNS sono una o più colonne coperte dall'indice univoco o dalla chiave primaria nella tabella che stai controllando. Sono stati identificati durante il controllo delle violazioni delle chiavi univoche. L'istruzione restituisce le chiavi duplicate e un conteggio dei duplicati per ciascuna.
Ad esempio, per la seguente query:
SELECT name,count(*) FROM public.TEST_NAMES GROUP BY name HAVING count(*) > 1;
L'output è simile al seguente:
name | count --------------------+------- Johnny | 2 Peter | 2 (2 rows)
In questo caso, vai al passaggio successivo per rimuovere le chiavi duplicate.
Se una delle colonne in KEY_COLUMNS è null, puoi ignorarla perché i vincoli univoci non si applicano alle colonne NULL.
Se non vengono trovate chiavi duplicate, puoi passare a Correggere gli indici incoerenti.
(Facoltativo, ma consigliato) Crea un backup per i record contenenti chiavi duplicate. Esegui la seguente istruzione per creare record di backup:
In questa istruzione, KEY_VALUES è un elenco di valori copiati dal risultato del passaggio precedente. Ad esempio:Esempio di codice
CREATE TABLE SCHEMA_NAME.TABLE_NAME_bak AS SELECT * FROM SCHEMA_NAME.TABLE_NAME WHERE (KEY_COLUMNS) IN (KEY_VALUES);
Esempio di codice
CREATE TABLE public.TEST_NAMES_bak AS SELECT * FROM public.TEST_NAMES WHERE (name) IN (('Johnny'),('Peter'))
Per un numero elevato di righe, è più facile sostituire il parametro ((KEY_VALUES)) nell'istruzione
IN
con l'istruzioneSELECT
del passaggio 2 senza il parametrocount
. Ad esempio:Esempio di codice
CREATE TABLE SCHEMA_NAME.TABLE_NAME_bak AS SELECT * FROM SCHEMA_NAME.TABLE_NAME WHERE (KEY_COLUMNS) IN ( SELECT (KEY_COLUMNS) FROM SCHEMA_NAME.TABLE_NAME GROUP BY (KEY_COLUMNS) HAVING count(*) > 1);
Aggiungi un ruolo di replica all'utente per disattivare gli attivatori:
Esempio di codice
ALTER USER CURRENT_USER with REPLICATION; SET session_replication_role = replica;
Esegui la seguente istruzione per eliminare le chiavi duplicate:
Esempio di codice
BEGIN; DELETE FROM SCHEMA_NAME.TABLE_NAME a USING ( SELECT min(ctid) AS ctid, KEY_COLUMNS FROM SCHEMA_NAME.TABLE_NAME GROUP BY KEY_COLUMNS HAVING count(*) > 1 ) b WHERE a.KEY_COLUMNS = b.KEY_COLUMNS AND a.ctid <> b.ctid;
Ad esempio, per KEY_COLUMNS con più colonne:
Esempio di codice
dove day e rnum sono KEY_COLUMNS.DELETE FROM public.test_random a USING ( SELECT min(ctid) AS ctid, day, rnum FROM public.test_random GROUP BY day, rnum HAVING count(*) > 1 ) b WHERE a.day=b.day and a.rnum = b.rnum AND a.ctid <> b.ctid;
L'esecuzione di questa istruzione conserva una riga ed elimina le altre per ogni insieme di righe duplicate. Se vuoi controllare quale versione della riga viene eliminata, esegui il seguente filtro nell'istruzione DELETE:
Esempio di codice
DELETE FROM SCHEMA_NAME.TABLE_NAME WHERE ( KEY_COLUMNS, ctid) = (KEY_VALUES, CTID_VALUE);
Completa i seguenti passaggi per verificare che il comando
DELETE
abbia restituito il numero di righe previsto senza errori:Esegui la seguente istruzione per identificare le righe in cui le tabelle sono state modificate:
Esempio di codice
SELECT schemaname, relname, n_tup_del, n_tup_upd FROM pg_stat_xact_all_tables WHERE n_tup_del+n_tup_upd > 0;
Se tutte le righe sono corrette, esegui il commit della transazione
DELETE
:Esempio di codice
END;
In caso di errori, ripristina le modifiche per correggerli:
Esempio di codice
ROLLBACK;
Dopo aver eliminato le chiavi duplicate, puoi indicizzare nuovamente l'indice.
Correggere gli indici incoerenti
Le sezioni seguenti descrivono come correggere le incoerenze dell'indice rilevate nell'istanza.
A seconda della configurazione del database, potresti dover eseguire le seguenti operazioni per ogni indice identificato nei passaggi precedenti:
Se l'operazione di indicizzazione non riesce a causa di violazioni chiave esterna, devi trovare e correggere queste violazioni.
Esegui di nuovo l'operazione di indicizzazione.
Prepararsi a eseguire nuovamente l'indicizzazione dell'indice
Trovare le dimensioni dell'indice
L'indicizzazione di database più grandi richiede più tempo rispetto a quella di database più piccoli. Per migliorare la velocità delle operazioni di indicizzazione e ridefinizione dell'indice dei database più grandi, puoi allocare più memoria e potenza della CPU a queste operazioni. Si tratta di un passaggio importante per pianificare l'operazione di indicizzazione. Dopo aver conosciuto le dimensioni dell'indice, puoi impostare le dimensioni della memoria utilizzata dall'operazione di indicizzazione e impostare il numero di worker in parallelo.
Esegui la seguente istruzione per trovare le dimensioni dell'indice, in kilobyte, dell'indice che vuoi correggere:
Esempio di codice
SELECT i.relname AS index_name, pg_size_pretty(pg_relation_size(x.indexrelid)) AS index_size FROM pg_index x JOIN pg_class i ON i.oid = x.indexrelid WHERE i.relname = 'INDEX_NAME';
L'output di questa istruzione è simile al seguente:
Output
index_name | index_size ------------+------------ my_index | 16 kB (1 row)
Imposta la dimensione della memoria da utilizzare per la ricorsione
In base alle dimensioni dell'indice determinate nella sezione precedente,
è importante impostare il valore appropriato per il parametro di configurazione
maintenance_work_mem
. Questo parametro specifica la quantità di memoria da utilizzare per l'operazione di indicizzazione. Ad esempio, se la dimensione dell'indice è superiore a 15 GB, ti consigliamo di modificare la memoria di manutenzione.
L'esempio seguente mostra come impostare maintenance_work_mem
:
Esempio di codice
SET maintenance_work_mem TO "1GB";
L'indicizzazione di database più grandi richiede più tempo rispetto a quella di database più piccoli. Per migliorare la velocità delle operazioni di indicizzazione e ricoindicizzazione, ti consigliamo di impostare maintenance_work_mem
su almeno il 2% della memoria dell'istanza per le istanze con almeno 4 GB di memoria durante questa operazione di ricoindicizzazione.
Impostare il numero di worker paralleli
Puoi aumentare il numero di worker in parallelo per la ricorsione impostando il parametro di configurazione max_parallel_maintenance_workers
nel database. Il valore predefinito di questo parametro è 2, ma può essere impostato su un valore superiore per aumentare il numero di worker per la ricorsione. Per le istanze con 8 o più core vCPU, consigliamo di impostare il valore del flag max_parallel_maintenance_workers
su 4.
Di seguito viene mostrato come identificare i valori impostati per questi parametri:
Esempio di codice
SHOW max_parallel_maintenance_workers; SHOW max_worker_processes; SHOW max_parallel_workers;
Il parametro max_parallel_maintenance_workers
è un sottoinsieme di
max_worker_processes
e limitato da
max_parallel_workers
. Se hai bisogno di più worker paralleli,
aumenta il valore di max_worker_processes
e
max_parallel_workers
.
L'esempio seguente mostra come impostare max_parallel_maintenance_workers
:
Esempio di codice
SET max_parallel_maintenance_workers TO 4;
Il parametro max_parallel_maintenance_workers
non garantisce l'allocazione dei lavoratori. Per verificare di avere avviato più worker paralleli
con il ricoindicizzazione, esegui la seguente query da un'altra sessione dopo
aver avviato la ricoindicizzazione:
Esempio di codice
SELECT leader.leader_pid,leader.pid "worker_pid",leader.query FROM pg_stat_activity leader, pg_stat_activity worker WHERE leader.leader_pid = worker.pid;
Esegui nuovamente l'indicizzazione dell'indice
Puoi eseguire nuovamente l'indicizzazione di un indice senza bloccare il carico di lavoro di produzione utilizzando l'utilitàpg_repack
. Questa utilità automatizza e semplifica il processo di rieccitazione simultaneo, consentendoti di eseguire la rieccitazione senza tempi di inattività. Per questa procedura, utilizza la pg_repack
versione 1.4.7.
Per eseguire nuovamente l'indicizzazione dell'indice utilizzando pg_repack
:
Scarica, compila e installa l'utilità
pg_repack
dalla pagina pg_repack.Crea l'estensione
pg_repack
:Esempio di codice
CREATE EXTENSION pg_repack;
Esegui il seguente comando per eseguire la reindicizzazione dell'indice in modo simultaneo:
Esempio di codice
pg_repack -h HOSTIP -p 5432 -U USERNAME -d "DATABASE_NAME" -i "INDEX_NAME" --no-superuser-check --no-kill-backend --wait-timeout=3600
Questo comando ha un output simile al seguente:
Output
INFO: repacking index "public.t_i_key"
Se si sono verificati errori durante l'esecuzione di
pg_repack
, puoi correggerli e riprovare. Dopo aver corretto tutti gli indici delle chiavi univoche e gli indici chiave primaria, devi controllare la presenza di chiave esterna estranee e correggere quelle rilevate.
Trovare e correggere le violazioni delle chiave esterna
Per informazioni su come trovare e correggere le violazioni delle chiave esterna, consulta Trovare e correggere le chiave esterna esterne.
Monitora le operazioni di indicizzazione nuovamente
A volte, l'operazione di indicizzazione può essere bloccata da altre sessioni. Ti consigliamo di controllare ogni 4 ore. Se l'operazione di indicizzazione nuovamente è bloccata, puoi annullare la sessione di blocco in modo che l'operazione possa essere completata.
Completa i seguenti passaggi per identificare le sessioni di blocco e in attesa e poi annullarle nell'operazione INDEX:
Per identificare le sessioni di blocco, esegui la seguente query:
Esempio di codice
SELECT pid, usename, pg_blocking_pids(pid) AS blocked_by, query AS blocked_query FROM pg_stat_activity WHERE cardinality(pg_blocking_pids(pid)) > 0;
Per annullare una sessione, esegui la seguente query utilizzando il PID della sessione di blocco della query precedente:
Esempio di codice
SELECT pg_cancel_backend(PID);
Verificare la coerenza degli indici
Devi continuare a verificare la presenza di incoerenze dell'indice per ogni indice incoerente. Dopo aver corretto tutti gli indici e le violazioni delle chiavi inconsistenti dell'istanza, puoi verificare che non esistano problemi seguendo i passaggi descritti nelle sezioni precedenti: