Fehlerbehebung für etcd

Auf dieser Seite erfahren Sie, wie Sie Probleme mit etcd für Google Distributed Cloud beheben.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

etcd-Datenlaufwerk ist voll

Der folgende Fehler tritt auf, wenn das etcd-Datenlaufwerk voll ist. Er kann auf verschiedene Weise beobachtet werden:

  • Die etcd-Logs können Zeitüberschreitungsfehler beim Schreiben von Anfragen anzeigen:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Möglicherweise werden auch Zeitüberschreitungsfehler für Verbindungen zu Peers angezeigt:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Aus den Logs des seriellen Ports kann möglicherweise hervorgehen, dass etcd aufgrund von Speicherplatzmangel nicht gestartet werden kann:

    failed on file /dev/stdout (No space left on device)
    

Verwenden Sie eine der folgenden Methoden, um die Größe Ihrer etcd-Instanz zu ermitteln:

SSH

  1. Stellen Sie über SSH eine Verbindung zu einem der Master-Knoten her und führen Sie den folgenden Befehl aus:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    Die Spalte DB_SIZE gibt die verwendete Größe an, wie in der folgenden komprimierten Beispielausgabe gezeigt:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. Rufen Sie in der Console die Seite "Cloud Monitoring" auf.

    Zur Seite "Cloud Monitoring"

  2. Wählen Sie Metrics Explorer aus.

  3. Wählen Sie den Messwert metric etcd_mvcc_db_total_size_in_bytes aus:

Um dieses Problem zu beheben, passen Sie die Größe des Datenlaufwerks für etcd mithilfe der entsprechenden Vorgehensweise für Ihren Speicheranbieter und Ihr Betriebssystem an. Fügen Sie genügend zusätzlichen Platz für zukünftiges etcd-Wachstum hinzu.

  1. Kontrollieren Sie nach der Größenanpassung des Laufwerks, ob noch eine Warnung zum Speicherplatz vorhanden ist:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Wenn in der letzten Spalte „NOSPACE“ angezeigt wird, schalte den Alarm so unscharf:

    TCDCTL_API=3 etcdctl alarm disarm
    

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.