Dataproc 日志

您可以在 Cloud Logging 中查看、搜索、过滤和归档 Dataproc 作业和集群日志。

如需了解您的费用，请参阅 Google Cloud 可观测性价格。
如需了解日志保留，请参阅日志保留期限。
如需停用所有日志或从 Logging 中排除日志，请参阅日志排除。
如需将日志从 Logging 路由到 Cloud Storage、BigQuery 或 Pub/Sub，请参阅路由和存储概览。

组件日志记录级别

创建集群时，请使用特定于组件的 log4j 集群属性（例如 hadoop-log4j）设置 Spark、Hadoop、Flink 和其他 Dataproc 组件日志记录级别。基于集群的组件日志记录级别适用于服务守护程序（例如 YARN ResourceManager）以及在集群上运行的作业。

如果某个组件（如 Presto 组件）不支持 log4j 属性，请编写一个修改该组件的 log4j.properties 或 log4j2.properties 文件的初始化操作。

特定于作业的组件日志记录级别：您还可以在提交作业时设置组件日志记录级别。这些日志记录级别会应用于作业，并且优先于您在创建集群时设置的日志记录级别。如需了解详情，请参阅集群与作业属性。

Spark 和 Hive 组件版本日志记录级别：

Spark 3.3.X 和 Hive 3.X 组件使用 log4j2 属性，而这些组件的先前版本使用 log4j 属性（请参阅 Apache Log4j2）。使用 spark-log4j: 前缀在集群上设置 Spark 日志记录级别。

示例：使用 Spark 3.1 设置 Dataproc 映像版本 2.0 以设置 log4j.logger.org.apache.spark：

gcloud dataproc clusters create ... \
    --properties spark-log4j:log4j.logger.org.apache.spark=DEBUG

示例：使用 Spark 3.3 设置 Dataproc 映像版本 2.1 以设置 logger.sparkRoot.level：

gcloud dataproc clusters create ...\
    --properties spark-log4j:logger.sparkRoot.level=debug

作业驱动程序日志记录级别

Dataproc 对作业驱动程序使用默认的日志记录级别 INFO。您可以使用 gcloud Dataproc 作业提交 --driver-log-levels 标志为一个或多个软件包更改此设置。

示例：

在提交读取 Cloud Storage 文件的 Spark 作业时设置 DEBUG 日志记录级别。

gcloud dataproc jobs submit spark ...\
    --driver-log-levels org.apache.spark=DEBUG,com.google.cloud.hadoop.gcsio=DEBUG

示例：

将 root 日志记录器级别设置为 WARN，将 com.example 日志记录器级别设置为 INFO。

gcloud dataproc jobs submit hadoop ...\
    --driver-log-levels root=WARN,com.example=INFO

Spark Executor 日志记录级别

如需配置 Spark 执行器日志记录级别，请执行以下操作：

准备 log4j 配置文件，然后将其上传到 Cloud Storage

复制并自定义位于 /etc/spark/conf/ 中的默认 log4j 配置
。

提交作业时引用您的配置文件。

示例：

gcloud dataproc jobs submit spark ...\
    --file gs://my-bucket/path/spark-log4j.properties \
    --properties spark.executor.extraJavaOptions=-Dlog4j.configuration=file:spark-log4j.properties

Spark 会将 Cloud Storage 属性文件下载到作业的本地工作目录中，在 -Dlog4j.configuration 中引用为 file:<name>。

Logging 中的 Dataproc 作业日志

如需了解如何在 Logging 中启用 Dataproc 作业驱动程序日志，请参阅 Dataproc 作业输出和日志。

访问 Logging 中的作业日志

使用 Logs Explorer、gcloud logging 命令或 Logging API 访问 Dataproc 作业日志。

控制台

Dataproc 作业驱动程序和 YARN 容器日志列在 Cloud Dataproc 作业资源下。

示例：运行采用以下选择的日志浏览器查询后的作业驱动程序日志：

资源：Cloud Dataproc Job
日志名称：dataproc.job.driver

示例：运行包含以下选项的日志浏览器查询后的 YARN 容器日志：

资源：Cloud Dataproc Job
日志名称：dataproc.job.yarn.container

gcloud

您可以使用 gcloud logging read 命令来读取作业日志条目。资源参数必须括在英文引号 ("...") 中。以下命令使用集群标签来过滤返回的日志条目。

gcloud logging read \
    "resource.type=cloud_dataproc_job \
    resource.labels.region=cluster-region \
    resource.labels.job_id=my-job-id"

示例输出（部分）：

jsonPayload:
  class: org.apache.hadoop.hdfs.StateChange
  filename: hadoop-hdfs-namenode-test-dataproc-resize-cluster-20190410-38an-m-0.log
  ,,,
logName: projects/project-id/logs/hadoop-hdfs-namenode
---
jsonPayload:
  class: SecurityLogger.org.apache.hadoop.security.authorize.ServiceAuthorizationManager
  filename: cluster-name-dataproc-resize-cluster-20190410-38an-m-0.log
  ...
logName: projects/google.com:hadoop-cloud-dev/logs/hadoop-hdfs-namenode

REST API

您可以使用 Logging REST API 列出日志条目（请参阅 entries.list）。

Logging 中的 Dataproc 集群日志

Dataproc 会将以下 Apache Hadoop、Spark、Hive、Zookeeper 和其他 Dataproc 集群日志导出到 Cloud Logging。

日志类型	日志名称	说明
主守护进程日志	hasoop-hdfs hadoop-hdfs-namenode hadoop-hdfs-secondary namenode hadoop-hdfs-zkfc hadoop-yarn-resourcemanager hadoop-yarn-timelineserver hive-metastore hive-server2 mapred-mapred-historyserver	日志节点 HDFS 名称节点 HDFS 辅助名称节点 Zookeeper 故障切换控制器 YARN 资源管理器 YARN 时间轴服务器 Hive Metastore Hive 服务器 2 Mapreduce 作业历史记录服务器 Zookeeper 服务器
工作器守护进程日志	hasoop-hdfs-datanode hadoop-yarn-nodemanager	HDFS 数据节点 YARN 节点管理器
系统日志	自动扩缩器 google.dataproc.agent google.dataproc.startup	Dataproc 自动扩缩器日志 Dataproc 代理日志 Dataproc 启动脚本日志 + 初始化操作日志

在 Cloud Logging 中访问集群日志

您可以使用 Logs Explorer、gcloud logging 命令或 Logging API 访问 Dataproc 集群日志。

控制台

选择以下查询，以在日志浏览器中查看集群日志：

资源：Cloud Dataproc Cluster
日志名称：log name

gcloud

您可以使用 gcloud logging read 命令来读取集群日志条目。资源参数必须括在英文引号 ("...") 中。以下命令使用集群标签来过滤返回的日志条目。

gcloud logging read <<'EOF'
    "resource.type=cloud_dataproc_cluster
    resource.labels.region=cluster-region
    resource.labels.cluster_name=cluster-name
    resource.labels.cluster_uuid=cluster-uuid"
EOF

示例输出（部分）：

jsonPayload:
  class: org.apache.hadoop.yarn.server.resourcemanager.ResourceTrackerService
  filename: hadoop-yarn-resourcemanager-cluster-name-m.log
  ...
logName: projects/project-id/logs/hadoop-yarn-resourcemanager
---
jsonPayload:
  class: org.apache.hadoop.yarn.server.resourcemanager.ResourceTrackerService
  filename: hadoop-yarn-resourcemanager-component-gateway-cluster-m.log
  ...
logName: projects/project-id/logs/hadoop-yarn-resourcemanager

运行

gcloud dataproc clusters describe cluster-name
--region=region

以列出可用于过滤日志记录结果的集群标签。

REST API

您可以使用 Logging REST API 列出日志条目（请参阅 entries.list）。

权限

要将日志写入 Logging，Dataproc 虚拟机服务账号必须具有 logging.logWriter 角色 IAM 角色。默认 Dataproc 服务账号具有此角色。如果使用自定义服务账号，则您必须将此角色分配给该服务账号。

保护日志

默认情况下，Logging 中的日志会进行静态加密。您可以启用客户管理的加密密钥 (CMEK) 来加密日志。如需详细了解 CMEK 支持，请参阅管理保护日志路由器数据的密钥和管理保护 Logging 存储数据的密钥。

后续步骤

探索 Google Cloud 可观测性