Memecahkan masalah GKE


Halaman ini mencantumkan halaman pemecahan masalah untuk masalah umum yang mungkin Anda alami saat menggunakan Google Kubernetes Engine (GKE). Halaman ini ditujukan untuk Admin dan arsitek, Spesialis keamanan, Spesialis jaringan, atau Spesialis penyimpanan yang memecahkan masalah konfigurasi GKE. Untuk mempelajari peran GKE lebih lanjut, lihat Peran dan tugas pengguna GKE umum.

Jika Anda baru mengenal pemecahan masalah di GKE atau ingin mendapatkan ringkasan tingkat tinggi tentang alat dan teknik dasar, mulailah dengan Pengantar pemecahan masalah.

Untuk mendiagnosis dan menyelesaikan masalah yang Anda alami di berbagai tahap saat bekerja dengan infrastruktur GKE, lihat bagian berikut:

Halaman ini juga memberikan akses ke topik pemecahan masalah yang lebih umum:

Untuk memecahkan masalah jaringan GKE, lihat Memecahkan masalah jaringan GKE dalam dokumentasi jaringan GKE.

Pengantar pemecahan masalah

Topik Deskripsi
Pengantar pemecahan masalah GKE Mulai pecahkan masalah GKE dengan mempelajari proses keseluruhan dan konsep dasar.
Meninjau status dan insiden layanan Pelajari cara memeriksa kondisi GKE dan layanan terkait Google Cloud untuk mengecualikan masalah platform.
Menilai kondisi cluster dan workload di konsol Google Cloud Pelajari cara menggunakan konsol Google Cloud untuk menyelidiki dan menyelesaikan masalah GKE.
Menyelidiki status cluster dengan kubectl Pelajari perintah dan teknik kubectl umum untuk mendiagnosis masalah di cluster dan workload Anda.
Melakukan analisis historis dengan Cloud Logging Pahami cara menggunakan Cloud Logging secara efektif untuk menemukan penyebab utama masalah di GKE.
Melakukan pemantauan proaktif dengan Cloud Monitoring Manfaatkan dasbor dan metrik Cloud Monitoring untuk mengidentifikasi, mendiagnosis, dan menyelesaikan masalah GKE.
Mempercepat diagnosis dengan Gemini Cloud Assist Pelajari cara Gemini dapat membantu mendiagnosis dan menyelesaikan masalah GKE.
Merangkum pemahaman: Contoh skenario pemecahan masalah Ikuti contoh langkah demi langkah pemecahan masalah skenario umum di GKE.

Penyiapan cluster

Topik Deskripsi
Pembuatan cluster Menyelesaikan masalah saat membuat cluster.
Cluster Autopilot Mendiagnosis dan memecahkan masalah cluster GKE Autopilot, termasuk pembuatan cluster, penghapusan namespace, penskalaan, dan masalah workload.
Alat command line Kubectl Memecahkan masalah alat command line kubectl di GKE, termasuk masalah autentikasi, otorisasi. Halaman ini juga menyertakan saran tentang cara memecahkan masalah proxy Konnectivity untuk memeriksa apakah proxy tersebut menyebabkan perintah kubectl logs, attach, exec, atau port-forward berhenti merespons.
Node pool standar Memecahkan masalah node pool GKE Standard, termasuk masalah pada pembuatan node pool, penyediaan upaya terbaik, metadata instance yang rusak, dan memigrasikan workload ke node pool baru.
Pendaftaran node Memecahkan masalah yang terjadi saat menambahkan node ke cluster GKE Standard, seperti kegagalan pendaftaran node dan prasyarat yang tidak terpenuhi untuk keberhasilan pendaftaran node.
Runtime container Memecahkan masalah runtime container di GKE, termasuk masalah pada containerd dan dockershim, serta registri pribadi.

Penyimpanan

Topik Deskripsi
Penyimpanan Memecahkan masalah penyimpanan, termasuk masalah terkait persistent disk regional, performa disk, dan perluasan volume.

Keamanan cluster

Topik Deskripsi
Authentication Memecahkan masalah autentikasi di GKE, termasuk masalah dengan RBAC, Workload Identity Federation for GKE, dan server metadata GKE.
Akun layanan Memecahkan masalah akun layanan, termasuk memulihkan akun layanan default dan mengaktifkan akun layanan default Compute Engine.
Rahasia lapisan aplikasi Memecahkan masalah yang dapat terjadi saat mengonfigurasi enkripsi secret lapisan aplikasi, termasuk kegagalan update dan error saat Anda tidak dapat menggunakan kunci Cloud KMS atau saat versi kunci Cloud KMS dihancurkan.

Root Certificate Authority Cluster akan segera habis masa berlakunya

Topik Deskripsi
Masa berlaku Otoritas Sertifikat (CA) Root akan segera berakhir Jika Certificate Authority (CA) root cluster Anda akan segera berakhir, pelajari cara melakukan rotasi kredensial untuk mencegah terganggunya operasi cluster normal.

Beban kerja

Topik Deskripsi
Workload yang di-deploy Memecahkan masalah error untuk workload yang berjalan di cluster GKE, termasuk PodUnschedulable. Baca bagian Pod Tidak Dapat Dijadwalkan untuk mendapatkan saran tentang error seperti MatchNodeSelector dan Does not have minimum availability.
Penarikan gambar Memecahkan masalah penarikan image. Pelajari penyebab status seperti ImagePullBackOff dan ErrImagePull serta cara menyelesaikan status ini dengan memperbaiki masalah umum seperti autentikasi dan konektivitas jaringan.
Peristiwa CrashLoopBackOff Memecahkan masalah peristiwa CrashLoopBackOff di GKE. Mendiagnosis masalah seperti kelelahan resource, kesalahan konfigurasi aplikasi, dan kegagalan pemeriksaan keaktifan.
Peristiwa OOM Memecahkan masalah peristiwa Kehabisan Memori (OOM) Kubernetes. Mengidentifikasi penyebab, membedakan jenis peristiwa, dan menerapkan solusi yang efektif untuk penghentian karena kehabisan memori (OOM) di tingkat container dan node.
Workload Arm Memecahkan masalah terkait workload Arm, termasuk Pod yang mengalami error di node Arm.
TPU Memecahkan masalah TPU, termasuk masalah kuota, penyediaan otomatis node, konfigurasi workload, dan penjadwalan.
GPU Memecahkan masalah GPU, termasuk masalah penginstalan driver GPU, error plugin perangkat, dan image container.

Pengelolaan cluster

Topik Deskripsi
Upgrade cluster Memecahkan masalah dan menyelesaikan masalah upgrade cluster dan node GKE, termasuk upgrade yang lama atau tidak selesai, upgrade otomatis yang tidak terduga, kegagalan, dan masalah pasca-upgrade.
Webhook Pahami cara memecahkan masalah dan memastikan stabilitas bidang kontrol cluster Anda saat menggunakan webhook penerimaan.
Namespace terjebak dalam status Terminating Pecahkan masalah terkait namespace yang terjebak dalam status Terminating dengan mengidentifikasi dan menghapus komponen tidak responsif yang memblokir penghapusan.
Operasi serentak Pecahkan masalah operasi serentak dengan mempelajari cara mengidentifikasi error ini dan menyelesaikannya dengan menunggu hingga operasi selesai.

Pemantauan

Topik Deskripsi
Metrik sistem Memecahkan masalah metrik sistem yang tidak muncul di Cloud Monitoring.
Dasbor pemantauan Memecahkan masalah dasbor pemantauan, termasuk masalah saat mengaktifkan pemantauan, resource Kubernetes yang tidak ada, dan izin.
Logging Memecahkan masalah logging, termasuk masalah terkait mengaktifkan logging, log yang tidak ada, dan kuota.

Error 4xx

Topik Deskripsi
Error 4xx Pecahkan masalah beberapa error 400, 401, 403, dan 404 yang mungkin Anda temui saat menggunakan GKE. Halaman ini juga berisi informasi tentang cara memecahkan masalah error izin edit yang tidak ada di akun.

Masalah umum

Topik Deskripsi
Masalah umum Identifikasi dan selesaikan masalah umum yang mungkin memengaruhi penggunaan GKE Anda.

Langkah berikutnya