诊断 Dataproc on GKE 集群
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Dataproc 提供了 gcloud CLI gclid clusters diagnose 命令,以帮助您排查 GKE 集群上的 Dataproc 集群和作业问题。此命令会将与集群相关的配置文件、日志和输出收集并归档到一个归档文件中,然后将归档文件上传到您在创建 Dataproc on GKE 集群时指定的 Cloud Storage 暂存存储桶。
诊断归档文件
下表列出了 dataproc clusters diagnose
命令归档文件中包含的指标和其他信息。
项 |
归档位置 |
虚拟 Dataproc on GKE Pod 运行的 GKE 节点指标: |
|
/system/NODE_NAME.json
|
正在运行的 Pod 的网络指标和文件系统状态: |
|
/system/POD_NAME.json
|
项 |
归档位置 |
集群 ConfigMap |
/conf/configmap
|
Kubernetes Deployment |
/conf/deployment |
基于角色的访问权限控制 (RBAC) |
/conf/role
/conf/rolebind
/conf/serviceaccount
|
日志
项 |
归档位置 |
代理日志 |
/logs/agent.log |
Spark Engine 日志 |
/logs/sparkengine.log |
过去 24 小时内的 Spark 驱动程序运行和完成的作业日志 |
/logs/DRIVER_ID |
项 |
归档位置 |
JobElection 对象 |
/jobattempts |
Kubernetes Pod 对象 |
/pods |
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2023-12-10。
[{
"type": "thumb-down",
"id": "hardToUnderstand",
"label":"Hard to understand"
},{
"type": "thumb-down",
"id": "incorrectInformationOrSampleCode",
"label":"Incorrect information or sample code"
},{
"type": "thumb-down",
"id": "missingTheInformationSamplesINeed",
"label":"Missing the information/samples I need"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]