查看 DAG、DAG 运行和任务

Cloud Composer 1 | Cloud Composer 2

本页面介绍了如何获取您环境中的 DAG 的相关信息。

查看 DAG 相关信息的方法

Cloud Composer 提供多种方法来获取有关您环境中 DAG 的详细信息:

  • DAG 界面是 Cloud Composer Google Cloud 控制台界面的一部分,专门用于查看和监控 DAG、DAG 运行以及各个任务。
  • Airflow 界面是 Airflow 的内置网页界面。
  • Airflow CLI 是 Airflow 的命令行界面。您可以使用 gcloud 运行 Airflow CLI 命令来获取有关 DAG 的信息。

Cloud Composer DAG 界面简介

DAG 界面是 Cloud Composer 的 Google Cloud 控制台界面的一部分,专门用于查看和监控 DAG、DAG 运行以及各个任务。

在 DAG 界面中,您可以执行以下操作:

  • 查看您环境中的 DAG 列表,包括时间表间隔、DAG 状态和说明。

  • 暂停、取消暂停和触发 DAG

  • 查看 DAG 运行详情,包括成功、活跃和失败的运行,以及自上次完成运行以来的时间。对于每个 DAG,您都可以查看与此特定 DAG 关联的 DAG 运行历史记录和任务实例的历史记录,包括已执行任务的日志。

  • 过滤 DAG 运行详情。例如,您可以选择时间间隔,并创建查询以选择所需信息。

  • 查看有关各个 DAG 和任务的详细信息。包括可视化的 DAG 图表、有关 DAG 中的任务的信息、DAG 源代码以及有关 DAG 的额外信息。

准备工作

  • DAG 界面需要启用 DAG 序列化

  • Cloud Composer 1.17.8 及更高版本支持 DAG 界面。

查看您的环境的 DAG 列表

控制台

环境的 DAG 标签页会显示 DAG 列表以及每个 DAG 的 DAG 运行详细信息。

如需查看 DAG 列表,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. DAG 列表列中,点击您的环境对应的 DAG 链接。

您可以使用过滤条件仅查看特定 DAG 或特定条件的详细信息。例如:

  1. 选择过滤条件字段。
  2. 从下拉列表中选择 DAG id 属性。
  3. 指定 DAG 的标识符。结果仅显示所选 DAG 的详细信息。
  4. (可选)如需添加更多 DAG,请添加 OR 运算符,后跟 DAG ID。
  5. (可选)如需按其他条件进行过滤,请在过滤条件字段中添加其他属性。例如,您可以通过指定 Failed runs:>0 来过滤运行失败的 DAG。

Airflow 界面

如需在 Airflow 网页界面中查看 DAG 列表,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. Airflow Web 服务器列中,点击与您的环境对应的 Airflow 链接。

  3. 使用具有相应权限的 Google 账号登录。

  4. 在 Airflow 网页界面中的 DAG 页面上,系统会显示您的环境的 DAG 列表。

gcloud

在 Airflow 1.10.* 中,运行 list_dags Airflow CLI 命令:

  gcloud composer environments run ENVIRONMENT_NAME \
    --location LOCATION \
    list_dags

在 Airflow 2 中,运行 dags list Airflow CLI 命令:

  gcloud composer environments run ENVIRONMENT_NAME \
    --location LOCATION \
    dags list -- -o plain

您需要将其中的:

  • ENVIRONMENT_NAME 替换为环境的名称。
  • LOCATION 替换为环境所在的区域。

查看 DAG 运行和任务的历史记录

控制台

DAG 详细信息页面上的运行标签页显示了单个 DAG 的运行历史记录。

如需查看 DAG 运行历史记录,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. DAG 列表列中,点击您的环境对应的 DAG 链接。

  3. 选择一个 DAG。

  4. DAG 详细信息页面上,转到运行标签页。

  5. 从列表中选择一个 DAG 运行以查看 DAG 运行详细信息,例如此 DAG 运行的任务实例状态、尝试次数和执行时长。您可以选择各个任务来查看任务实例日志。

Airflow 界面

如需在 Airflow 网页界面中查看 DAG 列表,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. Airflow Web 服务器列中,点击与您的环境对应的 Airflow 链接。

  3. 使用具有相应权限的 Google 账号登录。

  4. 在 Airflow 网页界面中,从菜单中依次选择浏览 > DAG 运行DAG 运行页面会显示您的环境的 DAG 运行作业。您可以点击运行 ID 列中的链接,获取有关任务的更多信息。

gcloud

在 Airflow 1.10.* 中,运行 list_dag_runs Airflow CLI 命令:

  gcloud composer environments run ENVIRONMENT_NAME \
    --location LOCATION \
    list_dag_runs -- DAG_ID

在 Airflow 2 中,运行 dags list-runs Airflow CLI 命令:

  gcloud composer environments run ENVIRONMENT_NAME \
    --location LOCATION \
    dags list-runs -- -d DAG_ID

您需要将其中的:

  • ENVIRONMENT_NAME 替换为环境的名称。
  • LOCATION 替换为环境所在的区域。
  • DAG_ID 替换为 DAG 名称。

您可以通过运行 tasks statetasks states-for-dag-run Airflow CLI 命令来获取有关任务实例的更多信息。

如需了解详情,请参阅访问 Airflow CLI 以及适用于 Airflow 1Airflow 2 的 Airflow CLI 参考文档。

查看 DAG 图表

控制台

DAG 详细信息页面上的 Diagram 标签页可以直观呈现具有任务依赖项的 DAG。

如需查看 DAG 图,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. DAG 列表列中,点击您的环境对应的 DAG 链接。

  3. 选择一个 DAG。

  4. DAG 详细信息页面上,转到图表标签页。

  5. (可选)如要查看任务的更多信息,请选择图表上的各个任务。

Airflow 界面

如需在 Airflow 网页界面中查看 DAG 图,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. Airflow Web 服务器列中,点击与您的环境对应的 Airflow 链接。

  3. 使用具有相应权限的 Google 账号登录。

  4. 在 Airflow 网页界面中的 DAG 页面上,系统会显示您的环境的 DAG 列表。

  5. 对于 DAG,在链接列中,点击图表视图链接。

查看 DAG 源代码和关于 DAG 的其他信息

控制台

您可以查看 DAG 的源代码和其他信息,例如 DAG 标识符以及环境存储桶中 DAG 定义文件的链接。

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. DAG 列表列中,点击您的环境对应的 DAG 链接。

  3. 选择一个 DAG。

  4. 如需查看 DAG 源代码,请转到图表标签页。

  5. 如需查看有关该 DAG 的更多信息,请转到来源标签页。

Airflow 界面

如需在 Airflow 网页界面中查看 DAG 图,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. Airflow Web 服务器列中,点击与您的环境对应的 Airflow 链接。

  3. 使用具有相应权限的 Google 账号登录。

  4. 在 Airflow 网页界面中,在 DAG 页面上,点击 DAG 的名称。

  5. 在包含 DAG 详细信息的页面中,转到可用标签页以查看关于该 DAG 的更多信息。

后续步骤