Questa pagina mostra come risolvere i problemi relativi a etcd per Google Distributed Cloud.
Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.Il disco dati etcd è pieno
Il seguente errore si verifica quando il disco dati etcd è pieno e potrebbe essere osservato in diversi modi:
I log etcd potrebbero mostrare errori di timeout per la scrittura delle richieste:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
Potresti anche visualizzare errori di timeout per le connessioni ai peer:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
I log delle porte seriali potrebbero indicare che etcd non può essere avviato per mancanza di spazio:
failed on file /dev/stdout (No space left on device)
Per determinare le dimensioni dell'istanza etcd, utilizza uno dei seguenti metodi:
SSH
Connettiti a uno dei nodi master mediante SSH ed esegui questo comando:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
La colonna
DB_SIZE
indica le dimensioni utilizzate, come mostrato nel seguente output di esempio ridotto:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Console
Nella console, vai alla pagina di Cloud Monitoring.
Seleziona Esplora metriche.
Seleziona la metrica
metric etcd_mvcc_db_total_size_in_bytes
.
Per risolvere il problema, ridimensiona il disco dati per etcd utilizzando la procedura appropriata per il provider di archiviazione e il sistema operativo. Aggiungi abbastanza spazio aggiuntivo per tenere conto della crescita futura di etcd.
Dopo aver ridimensionato il disco, controlla se è ancora presente un avviso sullo spazio su disco:
ETCDCTL_API=3 etcdctl alarm list
Se l'ultima colonna indica
NOSPACE
, disabilita l'allarme come segue:TCDCTL_API=3 etcdctl alarm disarm