Solucionar problemas de etcd para GKE en AWS

Esta página le muestra cómo resolver problemas con etcd para GKE en AWS.

Si necesita ayuda adicional, comuníquese con Atención al cliente de Cloud .

El disco de datos etcd está lleno

El siguiente error ocurre cuando el disco de datos etcd está lleno y puede observarse de diferentes maneras:

  • Los registros de etcd pueden mostrar errores de tiempo de espera para solicitudes de escritura:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    También es posible que veas errores de tiempo de espera para las conexiones con pares:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Los registros del puerto serie podrían indicar que etcd no puede iniciarse debido a la falta de espacio:

    failed on file /dev/stdout (No space left on device)
    

Para determinar el tamaño de su instancia etcd, utilice uno de los siguientes métodos:

SSH

  1. Conéctese a uno de los nodos maestros mediante SSH y ejecute el siguiente comando:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    La columna DB_SIZE indica el tamaño utilizado, como se muestra en el siguiente ejemplo condensado:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Consola

  1. En la consola, vaya a la página Monitoreo de la nube.

    Ir a la página de Monitoreo de la nube

  2. Seleccione Explorador de métricas .

  3. Seleccione la metric etcd_mvcc_db_total_size_in_bytes .

Para resolver este problema, ajuste el tamaño del disco de datos de etcd siguiendo el procedimiento adecuado para su proveedor de almacenamiento y sistema operativo. Añada suficiente espacio adicional para el crecimiento futuro de etcd.

  1. Después de cambiar el tamaño del disco, verifique si todavía hay una advertencia sobre el espacio en disco:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Si la última columna indica NOSPACE , desactive la alarma de la siguiente manera:

    ETCDCTL_API=3 etcdctl alarm disarm
    

¿Qué sigue?

Si necesita ayuda adicional, comuníquese con Atención al cliente de Cloud .