Fehlerbehebung für etcd

Auf dieser Seite erfahren Sie, wie Sie Probleme mit etcd für Google Distributed Cloud beheben.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

etcd-Datenlaufwerk ist voll

Der folgende Fehler tritt auf, wenn das etcd-Datenlaufwerk voll ist. Er kann sich auf unterschiedliche Weise bemerkbar machen:

  • In den etcd-Logs können Zeitüberschreitungsfehler für Schreibanfragen angezeigt werden:

    rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
    

    Es kann auch zu Zeitüberschreitungsfehlern bei Verbindungen zu Peers kommen:

    rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout
    etcd server doesn't start:
    
  • Die Logs des seriellen Ports können darauf hinweisen, dass etcd aufgrund von Platzmangel nicht gestartet werden kann:

    failed on file /dev/stdout (No space left on device)
    

Sie haben folgende Möglichkeiten, die Größe Ihrer etcd-Instanz zu ermitteln:

SSH

  1. Stellen Sie über SSH eine Verbindung zu einem der Masterknoten her und führen Sie den folgenden Befehl aus:

    ETCDCTL_API=3 etcdctl --write-out=table endpoint status
    

    In der DB_SIZE-Spalte wird die verwendete Größe angegeben, wie im folgenden komprimierten Beispiel zu sehen:

    +------------------+------------------+---------+---------+
    |    ENDPOINT      |        ID        | VERSION | DB SIZE |
    +------------------+------------------+---------+---------+
    | 10.240.0.17:2379 | 4917a7ab173fabe7 |  3.5.0  |   45 kB |
    | 10.240.0.18:2379 | 59796ba9cd1bcd72 |  3.5.0  |   45 kB |
    | 10.240.0.19:2379 | 94df724b66343e6c |  3.5.0  |   45 kB |
    +------------------+------------------+---------+---------+
    

Console

  1. Rufen Sie in der Console die Seite „Cloud Monitoring“ auf.

    Zur Seite „Cloud Monitoring“

  2. Wählen Sie Metrics Explorer aus.

  3. Wählen Sie den Messwert metric etcd_mvcc_db_total_size_in_bytes aus:

Um dieses Problem zu beheben, ändern Sie die Größe des Datenlaufwerks für etcd mit dem für Ihren Speicheranbieter und Ihr Betriebssystem geeigneten Verfahren. Fügen Sie genügend zusätzlichen Speicherplatz hinzu, um zukünftiges etcd-Wachstum zu berücksichtigen.

  1. Kontrollieren Sie nach der Größenanpassung des Laufwerks, ob noch eine Warnung zum Speicherplatz vorhanden ist:

    ETCDCTL_API=3 etcdctl alarm list
    
  2. Wenn in der letzten Spalte NOSPACE angezeigt wird, deaktivieren Sie den Alarm so:

    ETCDCTL_API=3 etcdctl alarm disarm
    

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.