诊断 GKE 集群上的 Dataproc
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Dataproc 提供了 gcloud CLI dataproc clusters diagnose 命令,可帮助您排查 Dataproc on GKE 集群和作业问题。此命令会收集并将与集群相关的配置文件、日志和输出归档到归档文件中,然后将归档文件上传到您在创建 Dataproc on GKE 集群时指定的 Cloud Storage 暂存存储桶。
诊断归档文件
下表列出了 dataproc clusters diagnose
命令归档文件中包含的指标和其他信息。
项 |
归档位置 |
运行虚拟 Dataproc on GKE pod 的 GKE 节点指标: |
|
/system/NODE_NAME.json
|
正在运行的 Pod 的网络指标和文件系统状态: |
- CPU 使用率
- 内存使用量
- 网络状态
- 文件系统状态
|
/system/POD_NAME.json
|
项 |
归档位置 |
集群 configmap |
/conf/configmap
|
Kubernetes Deployment |
/conf/deployment |
基于角色的访问权限控制 (RBAC) |
/conf/role
/conf/rolebind
/conf/serviceaccount
|
日志
项 |
归档位置 |
代理日志 |
/logs/agent.log |
Spark 引擎日志 |
/logs/sparkengine.log |
过去 24 小时内运行的 Spark 驱动程序和已完成的作业日志 |
/logs/DRIVER_ID |
项 |
归档位置 |
JobAttempt 对象 |
/jobattempts |
Kubernetes Pod 对象 |
/pods |
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-02-01。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-02-01。"],[],[]]