Fehlerbehebung für etcd

Auf dieser Seite wird beschrieben, wie Sie Probleme mit etcd für Google Distributed Cloud beheben können.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

etcd-Datenlaufwerk ist voll

Der folgende Fehler tritt auf, wenn das etcd-Datenlaufwerk voll ist. Er kann auf verschiedene Arten beobachtet werden:

  • Die etcd-Logs können Zeitüberschreitungsfehler beim Schreiben von Anfragen enthalten:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Möglicherweise werden auch Zeitüberschreitungsfehler für Verbindungen zu Peers angezeigt:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Die Logs des seriellen Ports können darauf hinweisen, dass etcd aufgrund von Speicherplatzmangel nicht gestartet werden kann:

    failed on file /dev/stdout (No space left on device)
    

Verwenden Sie eine der folgenden Methoden, um die Größe der etcd-Instanz zu ermitteln:

SSH

  1. Stellen Sie mit SSH eine Verbindung zu einem der Masterknoten her und führen Sie den folgenden Befehl aus:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    Die Spalte DB_SIZE gibt die verwendete Größe an, wie in der folgenden zusammengefassten Beispielausgabe gezeigt:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. Rufen Sie in der Console die Seite Cloud Monitoring auf.

    Zur Seite "Cloud Monitoring"

  2. Wählen Sie Metrics Explorer aus.

  3. Wählen Sie den Messwert metric etcd_mvcc_db_total_size_in_bytes aus:

Um dieses Problem zu beheben, passen Sie die Größe des Datenlaufwerks für etcd mithilfe des entsprechenden Verfahrens für Ihren Speicheranbieter und Ihr Betriebssystem an. Fügen Sie genügend zusätzlichen Speicherplatz für das zukünftige etcd-Wachstum hinzu.

  1. Kontrollieren Sie nach der Größenanpassung des Laufwerks, ob noch eine Warnung zum Speicherplatz vorhanden ist:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Wenn in der letzten Spalte NOSPACE angezeigt wird, deaktivieren Sie den Alarm so:

    ETCDCTL_API=3 etcdctl alarm disarm
    

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.