Resolver problemas do etcd para o GKE na AWS

Esta página mostra como resolver problemas com o etcd para o GKE na AWS.

Se precisar de mais ajuda, entre em contato com o Cloud Customer Care.

O disco de dados do etcd está cheio

O erro a seguir ocorre quando o disco de dados do etcd está cheio e pode ser observado de algumas maneiras diferentes:

  • Os registros do etcd podem mostrar erros de tempo limite para solicitações de gravação:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Você também pode ver erros de tempo limite para conexões com pares:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Os registros da porta serial podem indicar que o etcd não pode ser iniciado devido à falta de espaço:

    failed on file /dev/stdout (No space left on device)
    

Para determinar o tamanho da instância do etcd, use um dos seguintes métodos:

SSH

  1. Conecte-se a um dos nós mestre usando SSH e execute o seguinte comando:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    A coluna DB_SIZE indica o tamanho usado, conforme mostrado no exemplo de saída condensada a seguir:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. No console, acesse a página do Cloud Monitoring.

    Acessar a página do Cloud Monitoring

  2. Selecione Metrics Explorer.

  3. Selecione a métrica metric etcd_mvcc_db_total_size_in_bytes.

Para resolver esse problema, redimensione o disco de dados do etcd usando o procedimento apropriado para seu provedor de armazenamento e sistema operacional. Adicione espaço suficiente para considerar o crescimento do etcd no futuro.

  1. Depois que o disco for redimensionado, verifique se ainda há um alerta no espaço em disco:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Se a última coluna exibir NOSPACE, desative o alarme desta maneira:

    TCDCTL_API=3 etcdctl alarm disarm
    

A seguir

Se precisar de mais ajuda, entre em contato com o Cloud Customer Care.