Diagnostica Dataproc en clústeres de GKE

Dataproc proporciona el comando gcloud CLI dataproc clusters diagnose para ayudarte a solucionar problemas de trabajos y clústeres de Dataproc en GKE. Este comando recopila y archiva archivos de configuración, registros y resultados relacionados con el clúster en un archivo de almacenamiento. Luego, sube el archivo al bucket de preparación de Cloud Storage que especificaste cuando creaste tu clúster de Dataproc en GKE.

Cómo diagnosticar un archivo de almacenamiento

En las siguientes tablas, se enumeran las métricas y otra información que se incluye en el archivo de archivo del comando dataproc clusters diagnose.

Información del sistema

Elemento Ubicación del archivo
Métricas de nodos de GKE en los que se ejecutan pods de Dataproc virtual en GKE:
  • Uso de CPU
  • Uso de memoria
/system/NODE_NAME.json
Métricas de red y estado del sistema de archivos de los pods en ejecución:
  • Uso de CPU
  • Uso de memoria
  • Estado de la red
  • Estado del sistema de archivos
/system/POD_NAME.json

Información de configuración

Elemento Ubicación del archivo
ConfigMap del clúster /conf/configmap
Implementación de Kubernetes /conf/deployment
Control de acceso basado en roles (RBAC)
  • /conf/role
  • /conf/rolebind
  • /conf/serviceaccount

Registros

Elemento Ubicación del archivo
Registro del agente /logs/agent.log
Registro del motor de Spark /logs/sparkengine.log
Registros de trabajos en ejecución y completados del controlador de Spark en las últimas 24 horas /logs/DRIVER_ID

Información del trabajo y del pod

Elemento Ubicación del archivo
Objeto JobAttempt /jobattempts
Objeto de pod de Kubernetes /pods

Más información