排查环境创建问题

本页面针对创建 Cloud Composer 环境时可能遇到的问题提供了问题排查信息。

如需了解与更新和升级环境相关的问题排查信息,请参阅排查环境更新和升级问题

在创建 Cloud Composer 环境时,导致大多数问题的原因如下:

  • 服务帐号权限问题

  • 与网络相关的问题。例如,无效的 VPC 配置、IP 地址冲突或网络 IP 范围过窄

  • 与配额相关的问题

权限不足,无法创建环境

如果 Cloud Composer 由于您的账号权限不足而无法创建环境,它将输出以下错误消息:

ERROR: (gcloud.composer.environments.create) PERMISSION_DENIED: The caller
does not have permission

ERROR: (gcloud.composer.environments.create) PERMISSION_DENIED: User not
authorized to act as service account <service-account-name>.
The user must be granted iam.serviceAccounts.actAs permission, included in
Owner, Editor, Service Account User role. See https://cloud.google.com/iam/docs
/understanding-service-accounts for additional details.

解决方案:如访问权限控制中所述,将角色分配给您的帐号以及环境的服务帐号。

环境的服务帐号权限不足

创建 Cloud Composer 环境时,您需要指定运行环境的 GKE 节点的服务帐号。如果此服务帐号没有足够的权限来完成所请求的操作,Cloud Composer 会输出以下错误:

Errors in: [Web server]; Error messages:
  Creation of airflow web server version failed. This may be an intermittent
  issue of the App Engine service. You may retry the operation later.
{"ResourceType":"appengine.v1.version","ResourceErrorCode":"504","ResourceError
Message":"Your deployment has failed to become healthy in the allotted time
and therefore was rolled back. If you believe this was an error, try adjusting
the 'app_start_timeout_sec' setting in the 'readiness_check' section."}

解决方案:如访问权限控制中所述,将角色分配给您的帐号以及环境的服务帐号。

为环境选择的 VPC 网络不存在

您可以在创建 Cloud Composer 环境时指定 VPC 网络和子网。如果您未指定 VPC 网络,则 Cloud Composer 服务会为环境的区域和可用区选择 default VPC 和 default 子网。

如果指定的 VPC 网络和子网不存在,Cloud Composer 将输出以下错误:

Errors in: [GKE cluster]; Error messages:
        {"ResourceType":"gcp-types/container-v1:projects.locations.clusters","R
        esourceErrorCode":"400","ResourceErrorMessage":{"code":400,"message":"P
        roject \"<your composer project>\" has no network named \"non-existing-
        vpc\".","status":"INVALID_ARGUMENT","statusMessage":"Bad
        Request","requestPath":"https://container.googleapis.com/
        v1/projects/<your composer
        project>/locations/<zone>/clusters","httpMethod":"POST"}}

解决方案:创建环境之前,请确保新环境的 VPC 网络和子网已经存在。

在大规模网络中创建环境时遇到配额问题

在大规模网络中创建 Cloud Composer 环境时,您可能会遇到以下配额限制:

  • 已达到每个 VPC 网络的 VPC 对等互连数上限。
  • 已达到主要和次要子网 IP 范围数上限。
  • 已达到对等互连组中用于内部 TCP/UDP 负载平衡的转发规则数上限。

解决方案:使用大规模网络中的 Cloud Composer 的推荐方法。

不兼容的组织政策

您必须适当配置以下政策,才能成功创建 Cloud Composer 环境。

  • 必须停用 compute.disableSerialPortLogging
  • 必须停用 compute.requireOsLogin
  • 必须允许 compute.vmCanIpForward,因为 Cloud Composer 拥有的 GKE 集群使用的虚拟机是必需的。
  • 必须允许 compute.vmExternalIpAccess,因为 Cloud Composer 拥有的 GKE 集群使用的虚拟机是必需的。
  • compute.requireShieldedVm 必须设置为 False

如需了解详情,请参阅已知问题页面。

400 错误消息:部署 Airflow 网络服务器失败。

此错误可能是由于 IP 地址范围重叠导致无法创建专用 IP 环境的 GKE 集群造成的。

解决方案:检查环境集群中是否存在任何故障,并根据 GKE 错误消息解决问题。

后续步骤