Risolvere i problemi etcd per GKE su Azure

Questa pagina mostra come risolvere i problemi con etcd per GKE su Azure.

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.

Il disco dati etcd è pieno

Il seguente errore si verifica quando il disco dati etcd è pieno e potrebbe essere osservato in diversi modi:

  • I log etcd potrebbero mostrare errori di timeout per le richieste di scrittura:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Potresti anche visualizzare errori di timeout per le connessioni ai peer:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • I log della porta seriale potrebbero indicare che etcd non può avviarsi per mancanza di spazio:

    failed on file /dev/stdout (No space left on device)
    

Per determinare la dimensione dell'istanza etcd, utilizza uno dei seguenti metodi:

SSH

  1. Connettiti a uno dei nodi master utilizzando SSH ed esegui questo comando:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    La colonna DB_SIZE indica la dimensione utilizzata, come mostrato nel seguente output di esempio ridotto:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. Nella console, vai alla pagina di Cloud Monitoring.

    Vai alla pagina di Cloud Monitoring

  2. Seleziona Metrics Explorer.

  3. Seleziona la metrica metric etcd_mvcc_db_total_size_in_bytes.

Per risolvere il problema, ridimensiona il disco dati per etcd utilizzando la procedura appropriata per il provider di spazio di archiviazione e il sistema operativo. Aggiungi altro spazio sufficiente per tenere conto della futura crescita etcd.

  1. Dopo il ridimensionamento del disco, controlla se viene visualizzato ancora un avviso relativo allo spazio su disco:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Se l'ultima colonna riporta NOSPACE, disabilita l'allarme come segue:

    TCDCTL_API=3 etcdctl alarm disarm
    

Passaggi successivi

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.