Dataproc menyediakan perintah gcloud CLI dataproc clusters diagnose
untuk membantu Anda memecahkan masalah Dataproc pada cluster dan tugas GKE. Perintah ini mengumpulkan dan mengarsipkan file konfigurasi, log, dan output terkait cluster ke dalam file arsip, lalu mengupload arsip ke bucket staging Cloud Storage yang Anda tentukan saat membuat Dataproc di cluster GKE.
Mendiagnosis file arsip
Tabel berikut mencantumkan metrik dan informasi lainnya yang disertakan dalam
file arsip perintah dataproc clusters diagnose
.
Item |
Lokasi arsip |
Metrik node GKE
tempat pod Dataproc virtual di GKE berjalan: |
- Penggunaan CPU
- Penggunaan memori
|
/system/NODE_NAME.json
|
Metrik jaringan dan status sistem file pod yang berjalan: |
- Penggunaan CPU
- Penggunaan memori
- Status jaringan
- Status sistem file
|
/system/POD_NAME.json
|
Log
Item |
Lokasi arsip |
Log agen |
/logs/agent.log |
Log mesin Spark |
/logs/sparkengine.log |
Log tugas yang dijalankan dan diselesaikan oleh driver Spark selama 24 jam terakhir |
/logs/DRIVER_ID |
Item |
Lokasi arsip |
Objek JobAttempt |
/jobattempts |
Objek Pod Kubernetes |
/pods |