Soluciona problemas de etcd para GKE en Azure
En esta página, se muestra cómo resolver problemas con etcd para GKE en Azure.
Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.El disco de datos de etcd está lleno
El siguiente error ocurre cuando el disco de datos de etcd está lleno y se puede observar de diferentes maneras:
Los registros de etcd pueden mostrar errores de tiempo de espera para las solicitudes de escritura:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
También es posible que veas errores de tiempo de espera para las conexiones a pares:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
Los registros del puerto en serie pueden indicar que etcd no puede iniciarse debido a la falta de espacio:
failed on file /dev/stdout (No space left on device)
Para determinar el tamaño de tu instancia de etcd, usa uno de los siguientes métodos:
SSH
Conéctate a uno de los nodos principales con SSH y ejecuta el siguiente comando:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
La columna
DB_SIZE
indica el tamaño usado, como se muestra en el siguiente resultado de ejemplo resumido:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Console
En la consola, ve a la página Cloud Monitoring.
Selecciona Explorador de métricas.
Selecciona la métrica
metric etcd_mvcc_db_total_size_in_bytes
.
Para resolver este problema, cambia el tamaño del disco de datos para etcd a través del procedimiento adecuado para tu proveedor de almacenamiento y sistema operativo. Agrega espacio adicional suficiente para cubrir el crecimiento de etcd futuro.
Después de cambiar el tamaño del disco, verifica si aún hay una advertencia sobre el espacio en el disco:
ETCDCTL_API=3 etcdctl alarm list
Si la última columna informa
NOSPACE
, desactiva la alarma de la siguiente manera:TCDCTL_API=3 etcdctl alarm disarm