Risolvere i problemi etcd per GKE su Azure
Questa pagina mostra come risolvere i problemi con etcd per GKE su Azure.
Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.Il disco dati etcd è pieno
Il seguente errore si verifica quando il disco dati etcd è pieno e potrebbe essere osservato in diversi modi:
I log etcd potrebbero mostrare errori di timeout per le richieste di scrittura:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
Potresti anche visualizzare errori di timeout per le connessioni ai peer:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
I log della porta seriale potrebbero indicare che etcd non può avviarsi per mancanza di spazio:
failed on file /dev/stdout (No space left on device)
Per determinare la dimensione dell'istanza etcd, utilizza uno dei seguenti metodi:
SSH
Connettiti a uno dei nodi master utilizzando SSH ed esegui questo comando:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
La colonna
DB_SIZE
indica la dimensione utilizzata, come mostrato nel seguente output di esempio ridotto:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Console
Nella console, vai alla pagina di Cloud Monitoring.
Seleziona Metrics Explorer.
Seleziona la metrica
metric etcd_mvcc_db_total_size_in_bytes
.
Per risolvere il problema, ridimensiona il disco dati per etcd utilizzando la procedura appropriata per il provider di spazio di archiviazione e il sistema operativo. Aggiungi altro spazio sufficiente per tenere conto della futura crescita etcd.
Dopo il ridimensionamento del disco, controlla se viene visualizzato ancora un avviso relativo allo spazio su disco:
ETCDCTL_API=3 etcdctl alarm list
Se l'ultima colonna riporta
NOSPACE
, disabilita l'allarme come segue:TCDCTL_API=3 etcdctl alarm disarm