etcd-Fehlerbehebung für GKE on AWS beheben

Auf dieser Seite wird beschrieben, wie Sie Probleme mit etcd für GKE on AWS beheben.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

etcd-Datenlaufwerk ist voll

Der folgende Fehler tritt auf, wenn das etcd-Datenlaufwerk voll ist, und kann auf unterschiedliche Weise beobachtet werden:

  • Die etcd-Logs enthalten möglicherweise Zeitüberschreitungsfehler beim Schreiben von Anfragen:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Möglicherweise werden auch Zeitüberschreitungsfehler für Verbindungen zu Peers angezeigt:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Die Logs des seriellen Ports weisen möglicherweise darauf hin, dass etcd aufgrund von Speicherplatzmangel nicht gestartet werden kann:

    failed on file /dev/stdout (No space left on device)
    

Verwenden Sie eine der folgenden Methoden, um die Größe der etcd-Instanz zu ermitteln:

SSH

  1. Stellen Sie über SSH eine Verbindung zu einem der Master-Knoten her und führen Sie den folgenden Befehl aus:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    Die Spalte DB_SIZE gibt die verwendete Größe an, wie in der folgenden komprimierten Beispielausgabe gezeigt:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. Rufen Sie in der Console die Seite „Cloud Monitoring“ auf.

    Zur Seite „Cloud Monitoring“

  2. Wählen Sie Metrics Explorer aus.

  3. Wählen Sie den Messwert metric etcd_mvcc_db_total_size_in_bytes aus:

Um dieses Problem zu beheben, passen Sie die Größe des Datenlaufwerks für etcd mithilfe der entsprechenden Vorgehensweise für Ihren Speicheranbieter und Ihr Betriebssystem an. Fügen Sie genügend zusätzlichen Speicherplatz hinzu, um zukünftiges etcd-Wachstum zu berücksichtigen.

  1. Kontrollieren Sie nach der Größenanpassung des Laufwerks, ob noch eine Warnung zum Speicherplatz vorhanden ist:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Wenn in der letzten Spalte NOSPACE angezeigt wird, kannst du den Alarm so unscharf schalten:

    TCDCTL_API=3 etcdctl alarm disarm
    

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.