Esta página mostra como resolver problemas com o etcd para o GKE na AWS.
Se precisar de mais ajuda, entre em contato com o Cloud Customer Care.O disco de dados do etcd está cheio
O erro a seguir ocorre quando o disco de dados do etcd está cheio e pode ser observado de algumas maneiras diferentes:
Os registros do etcd podem mostrar erros de tempo limite para solicitações de gravação:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
Você também pode ver erros de tempo limite para conexões com pares:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
Os registros da porta serial podem indicar que o etcd não pode ser iniciado devido à falta de espaço:
failed on file /dev/stdout (No space left on device)
Para determinar o tamanho da instância do etcd, use um dos seguintes métodos:
SSH
Conecte-se a um dos nós mestre usando SSH e execute o seguinte comando:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
A coluna
DB_SIZE
indica o tamanho usado, conforme mostrado no exemplo de saída condensada a seguir:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Console
No console, acesse a página do Cloud Monitoring.
Selecione Metrics Explorer.
Selecione a métrica
metric etcd_mvcc_db_total_size_in_bytes
.
Para resolver esse problema, redimensione o disco de dados do etcd usando o procedimento apropriado para seu provedor de armazenamento e sistema operacional. Adicione espaço suficiente para considerar o crescimento do etcd no futuro.
Depois que o disco for redimensionado, verifique se ainda há um alerta no espaço em disco:
ETCDCTL_API=3 etcdctl alarm list
Se a última coluna exibir
NOSPACE
, desative o alarme desta maneira:TCDCTL_API=3 etcdctl alarm disarm