Memecahkan masalah etcd untuk GKE di Azure
Halaman ini menunjukkan cara menyelesaikan masalah terkait etcd untuk GKE di Azure.
Jika Anda memerlukan bantuan lainnya, hubungi Cloud Customer Care.disk data etcd penuh
Error berikut terjadi saat disk data etcd penuh, dan mungkin diamati dengan beberapa cara yang berbeda:
Log etcd mungkin menampilkan error waktu tunggu untuk menulis permintaan:
rafthttp: failed to save KV snapshot (write /var/etcd/data/member/snap/tmp720030520: no space left on device)
Anda mungkin juga melihat error waktu tunggu untuk koneksi ke peer:
rafthttp: health check for peer [peer-id] could not connect: dial tcp [peer-ip]:2380: i/o timeout etcd server doesn't start:
Log port serial mungkin menunjukkan bahwa etcd tidak dapat dimulai karena kurangnya ruang:
failed on file /dev/stdout (No space left on device)
Untuk menentukan ukuran instance etcd, gunakan salah satu metode berikut:
SSH
Hubungkan ke salah satu node master menggunakan SSH dan jalankan perintah berikut:
ETCDCTL_API=3 etcdctl --write-out=table endpoint status
Kolom
DB_SIZE
menunjukkan ukuran yang digunakan, seperti ditunjukkan dalam contoh output ringkas berikut:+------------------+------------------+---------+---------+ | ENDPOINT | ID | VERSION | DB SIZE | +------------------+------------------+---------+---------+ | 10.240.0.17:2379 | 4917a7ab173fabe7 | 3.5.0 | 45 kB | | 10.240.0.18:2379 | 59796ba9cd1bcd72 | 3.5.0 | 45 kB | | 10.240.0.19:2379 | 94df724b66343e6c | 3.5.0 | 45 kB | +------------------+------------------+---------+---------+
Konsol
Di konsol, buka halaman Cloud Monitoring.
Pilih Metrics Explorer.
Pilih metrik
metric etcd_mvcc_db_total_size_in_bytes
.
Untuk mengatasi masalah ini, ubah ukuran disk data untuk etcd menggunakan prosedur yang sesuai bagi penyedia penyimpanan dan sistem operasi Anda. Menambahkan ruang tambahan yang cukup untuk memperhitungkan pertumbuhan etcd di masa mendatang.
Setelah ukuran disk diubah, periksa apakah masih ada peringatan mengenai kapasitas disk:
ETCDCTL_API=3 etcdctl alarm list
Jika kolom terakhir melaporkan
NOSPACE
, nonaktifkan alarm seperti berikut:TCDCTL_API=3 etcdctl alarm disarm