Questa pagina mostra come risolvere i problemi relativi a etcd per Google Distributed Cloud.
Se hai bisogno di ulteriore assistenza, contatta Assistenza clienti Google Cloud.Il disco dati etcd è pieno
Il seguente errore si verifica quando il disco dati etcd è pieno e potrebbe essere osservato in diversi modi:
I log etcd potrebbero mostrare errori di timeout per le richieste di scrittura:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
Potresti anche visualizzare errori di timeout per le connessioni ai peer:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
I log della porta seriale potrebbero indicare che etcd non può essere avviato a causa di spazio insufficiente:
failed on file /dev/stdout (No space left on device)
Per determinare le dimensioni dell'istanza etcd, utilizza uno dei seguenti metodi:
SSH
Connettiti a uno dei nodi master tramite SSH ed esegui il seguente comando:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
La colonna
DB_SIZE
indica la dimensione utilizzata, come mostrato di seguito output di esempio ridotto:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Console
Nella console, vai alla pagina Cloud Monitoring.
Seleziona Esplora metriche.
Seleziona la metrica
metric etcd_mvcc_db_total_size_in_bytes
.
Per risolvere il problema, ridimensiona il disco dati per etcd utilizzando la procedura appropriata per il tuo provider di archiviazione e il tuo sistema operativo. Aggiungi spazio aggiuntivo sufficiente per tenere conto della crescita futura di etcd.
Dopo aver ridimensionato il disco, controlla se è ancora presente un avviso sullo spazio su disco:
ETCDCTL_API=3 etcdctl alarm list
Se l'ultima colonna indica
NOSPACE
, disabilita l'allarme come segue:ETCDCTL_API=3 etcdctl alarm disarm