将 Dataproc Metastore 事件路由到 GKE

Eventarc 触发器声明您对某个事件或一系列事件感兴趣。如需配置事件路由,您可以为触发器指定过滤条件,包括事件来源以及在 Google Kubernetes Engine (GKE) 集群中运行的目标 GKE 服务。请注意,目标只能包含在具有公共端点的(公共或专用)GKE 集群中运行的服务。如需定位具有专用端点的 GKE 集群中的服务,请将事件路由到内部 HTTP 端点

Eventarc 通过 HTTP 请求以 CloudEvents 格式将事件传送到事件接收器。

以下说明介绍如何配置到 GKE 服务的事件路由(由直接 Dataproc Metastore 事件触发)。如需了解详情,请参阅支持的直接事件列表。

准备工作

您必须在运行目标服务的 GKE 集群上启用 Workload Identity。正确设置事件转发器需要使用 Workload Identity,由于 Workload Identity 增强的安全属性和可管理性,因此它是从 GKE 中运行的应用访问 Google Cloud 服务的推荐方法

Eventarc 事件到 GKE 目标架构

Workload Identity

在 GKE 上运行的应用可能需要访问 Google Cloud API。Workload Identity 允许 GKE 集群中的 Kubernetes 服务账号充当 IAM 服务账号。访问 Google Cloud API 时,使用已配置的 Kubernetes 服务账号的 Pod 会自动以 IAM 服务账号身份进行身份验证。借助 Workload Identity,您可以为集群中的每个应用分配不同的精细身份和授权。 请注意,您必须向 Eventarc 触发器的服务账号授予特定权限。在本文档中,请参阅创建服务账号的步骤。

如需详细了解如何在 GKE 集群上启用和配置 Workload Identity,请参阅使用 Workload Identity

事件转发器

Eventarc 的事件转发器会从 Eventarc 拉取新事件并将其转发到 GKE 目标。此组件充当 Pub/Sub 传输层与 GKE 服务之间的中介。它适用于现有服务,还支持信令服务(包括未在全代管式集群外部公开的服务),同时简化设置和维护。 在网络级层,如需接收 GKE 服务中的事件,您无需向外部流量开放服务,因为所有事件都从位于同一 GKE 集群中的来源传送。

请注意,事件转发器的生命周期由 Eventarc 管理,如果您不小心删除了事件转发器,Eventarc 将恢复此组件。

对于指向 GKE 目标的每个触发器,事件转发器(专门配置的 gke-forwarder Pod)会执行以下操作:

  1. 事件转发器使用 Pub/Sub API 打开与触发器传输器(Pub/Sub 主题和订阅)的 StreamingPull 连接,并在事件可用时接收事件。

  2. 事件转发器将事件转换为正确的 CloudEvents 格式,对其进行编码并将其作为 HTTP POST 请求传送到目标 GKE 服务。

Eventarc 服务代理需要运行并定期更新 gke-forwarder 实例的权限。您必须为每个项目授予一次此权限。如需了解详情,请参阅本文档中的启用 GKE 目标

准备创建触发器

对于以 GKE 服务为目标的每个触发器,Eventarc 会创建一个事件转发器组件。Eventarc 需要具有在 GKE 集群中安装组件和管理资源的权限。在为 GKE 目标创建 Eventarc 触发器之前,请务必完成以下任务。

控制台

  1. 在 Google Cloud 控制台的“项目选择器”页面上,选择或创建 Google Cloud 项目

    转到“项目选择器”

  2. 启用 Eventarc API、Eventarc Publishing API、Google Kubernetes Engine API 和 Resource Manager API。

    启用 API

  3. 如果适用,请启用与直接事件相关的 API。例如,对于 Dataproc Metastore 事件,请启用 Dataproc Metastore API。

  4. 如果您还没有用户管理的服务账号,请创建一个,然后为其授予必要的角色和权限,以便 Eventarc 可以管理目标服务的事件。

    1. 在 Google Cloud 控制台中,进入创建服务账号页面。

      转到“创建服务账号”

    2. 选择您的项目。

    3. 服务账号名称字段中,输入一个名称。Google Cloud 控制台会根据此名称填充服务账号 ID 字段。

      服务账号说明字段中,输入说明。例如 Service account for event trigger

    4. 点击创建并继续

    5. 如需提供适当的访问权限,请在选择角色列表中,选择要向服务账号授予的所需 Identity and Access Management (IAM) 角色。如需了解详情,请参阅 GKE 目标的角色和权限

      如需添加其他角色,请点击 添加其他角色,然后添加其他各个角色。

    6. 点击继续

    7. 如需完成账号的创建过程,请点击完成

gcloud

  1. 在 Google Cloud 控制台中,激活 Cloud Shell。

    激活 Cloud Shell

    Cloud Shell 会话随即会在 Google Cloud 控制台的底部启动,并显示命令行提示符。Cloud Shell 是一个已安装 Google Cloud CLI 且已为当前项目设置值的 Shell 环境。该会话可能需要几秒钟时间来完成初始化。

  2. 启用 Eventarc API、Eventarc Publishing API、Google Kubernetes Engine API 和 Resource Manager API。

    gcloud services enable eventarc.googleapis.com \
        eventarcpublishing.googleapis.com \
        container.googleapis.com \
        cloudresourcemanager.googleapis.com

  3. 如果适用,请启用与直接事件相关的 API。例如,对于 Dataproc Metastore 事件,请启用 metastore.googleapis.com

  4. 如果您还没有用户管理的服务账号,请创建一个,然后为其授予必要的角色和权限,以便 Eventarc 可以管理目标 GKE 目标的事件。

    1. 创建服务账号:

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
      

      SERVICE_ACCOUNT_NAME 替换为服务账号的名称。该名称必须介于 6 到 30 个字符之间,且可以包含小写字母数字字符和短划线。在服务账号创建完毕后,无法再更改其名称。

    2. 授予所需的 Identity and Access Management (IAM) 角色或权限。如需了解详情,请参阅 GKE 目标的角色和权限

启用 GKE 目标

如需允许 Eventarc 管理 GKE 集群中的资源,请启用 GKE 目标,并将 Eventarc 服务代理与所需的角色绑定。

  1. 为 Eventarc 启用 GKE 目标:

    gcloud eventarc gke-destinations init
    
  2. 在系统提示绑定所需角色时,输入 y

    绑定以下角色:

    • roles/compute.viewer
    • roles/container.developer
    • roles/iam.serviceAccountAdmin

创建触发器

您可以使用 Google Cloud CLI 或通过 Google Cloud 控制台创建 Eventarc 触发器。

控制台

  1. 在 Google Cloud 控制台中,进入 Eventarc 触发器页面。

    转到“触发器”

  2. 点击 创建触发器
  3. 输入触发器名称

    这是触发器的 ID,必须以字母开头。最多可包含 63 个小写字母、数字或连字符。

  4. 触发器类型部分,选择 Google 来源
  5. 事件提供方列表中,选择 Dataproc Metastore

    请注意,关联的 Google Cloud 文档中使用的事件提供方名称可能没有 Cloud 或 Google Cloud 前缀。例如,在控制台中,Memorystore for Redis 称为 Google Cloud Memorystore for Redis

  6. 事件类型列表中,从“直接”事件中选择一种事件类型。
  7. 如需指定事件载荷的编码,请在事件数据内容类型列表中选择 application/jsonapplication/protobuf

    请注意,采用 JSON 格式的事件载荷大于采用 Protobuf 格式的事件载荷。这可能会影响可靠性,具体取决于您的事件目标及其事件大小限制。如需了解详情,请参阅已知问题

  8. 区域列表中,选择生成事件的 Google Cloud 服务所在的区域。

    如需了解详情,请参阅 Eventarc 位置

  9. 如果适用于事件提供方,请点击添加过滤条件并指定以下内容:
    1. 属性 1 字段中,根据您选择的直接事件,选择可用作事件过滤条件的资源 ID
    2. 选择一个运算符:
    3. 属性值 1 字段中,根据您选择的运算符,输入确切的值或应用路径模式。
    4. 如果属性 2 字段适用,请指定适当的值。
  10. 选择将调用您的服务或工作流的服务账号

    或者,您可以创建新的服务账号。

    这用于指定与触发器相关联且您之前向其授予 Eventarc 所需的特定角色的 Identity and Access Management (IAM) 服务账号电子邮件。

  11. 事件目的地列表中,选择 Kubernetes Engine
  12. 选择一项服务。

    这是接收触发器事件的服务的名称。该服务必须与触发器位于同一项目中,并在事件生成时,接收作为 HTTP POST 请求发送到其根网址路径 (/) 的事件。

  13. (可选)您可以指定将传入请求发送到的服务网址路径

    这是触发器的事件应该发送到的目的地服务上的相对路径。例如://routerouteroute/subroute

  14. 点击创建
  15. 创建触发器之后,您便无法修改事件来源过滤条件。请创建新触发器,并删除旧触发器。 如需了解详情,请参阅管理触发器

gcloud

您可以通过运行包含必需和可选标志的 gcloud eventarc triggers create 命令来创建触发器。

  gcloud eventarc triggers create TRIGGER \
      --location=LOCATION \
      --destination-gke-cluster=DESTINATION_GKE_CLUSTER \
      --destination-gke-location=DESTINATION_GKE_LOCATION \
      --destination-gke-namespace=DESTINATION_GKE_NAMESPACE \
      --destination-gke-service=DESTINATION_GKE_SERVICE \
      --destination-gke-path=DESTINATION_GKE_PATH \
      --event-filters="type=EVENT_FILTER_TYPE" \
      --event-filters="COLLECTION_ID=RESOURCE_ID" \
      --event-filters-path-pattern="COLLECTION_ID=PATH_PATTERN" \
      --event-data-content-type="EVENT_DATA_CONTENT_TYPE" \
      --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com"

替换以下内容:

  • TRIGGER:触发器的 ID 或完全限定标识符
  • LOCATION:Eventarc 触发器的位置。或者,您可以设置 eventarc/location 属性;例如 gcloud config set eventarc/location us-central1

    为避免任何性能和数据驻留问题,该位置必须与生成事件的 Google Cloud 服务的位置匹配。如需了解详情,请参阅 Eventarc 位置

  • DESTINATION_GKE_CLUSTER:运行接收事件的目标 GKE 服务的 GKE 集群的名称。
  • DESTINATION_GKE_LOCATION:(可选)在其中运行目标 GKE 服务的 GKE 集群的 Compute Engine 区域。如果未指定,系统会假定该集群是区域级集群,并且与触发器位于同一区域。
  • DESTINATION_GKE_NAMESPACE:(可选)运行目标 GKE 服务的命名空间。如果未指定,则使用 default 命名空间。
  • DESTINATION_GKE_SERVICE:接收触发器事件的 GKE 服务名称。该服务可以位于任何 GKE 支持位置,无需与触发器位于同一位置。但是,该服务必须与触发器位于同一项目中,并在事件生成时,接收作为 HTTP POST 请求发送到其根网址路径 (/) 的事件。
  • DESTINATION_GKE_PATH:(可选)您在目标 GKE 服务上指定的相对路径,触发器的事件应发送到该路径。例如://routerouteroute/subroute
  • EVENT_FILTER_TYPE:事件的标识符。方法的 API 调用成功时会生成事件。对于长时间运行的操作,事件仅会在操作结束时生成,并且仅在操作成功执行时才会生成。如需查看支持的事件类型的列表,请参阅 Eventarc 支持的事件类型
  • COLLECTION_ID(可选):可充当事件过滤条件的资源组件,它是以下之一:
    • backup
    • federation
    • metadataimport
    • service
  • RESOURCE_ID:用作关联集合的过滤值的资源的标识符。如需了解详情,请参阅资源 ID
  • PATH_PATTERN:过滤资源时要应用的路径模式
  • EVENT_DATA_CONTENT_TYPE:(可选)事件载荷的编码,可以为 application/jsonapplication/protobuf。默认编码为 application/json

    请注意,采用 JSON 格式的事件载荷大于采用 Protobuf 格式的事件载荷。这可能会影响可靠性,具体取决于您的事件目标及其事件大小限制。如需了解详情,请参阅已知问题

  • SERVICE_ACCOUNT_NAME:用户管理的服务账号的名称。
  • PROJECT_ID:您的 Google Cloud 项目 ID。

备注:

  • --event-filters="type=EVENT_FILTER_TYPE" 标志是必需的。如果未设置其他事件过滤条件,则匹配所有资源的事件。
  • EVENT_FILTER_TYPE 创建后无法更改。如需更改 EVENT_FILTER_TYPE,请创建一个新触发器并删除旧触发器。
  • 每个触发器可以有多个事件过滤条件,在一个 --event-filters=[ATTRIBUTE=VALUE,...] 标志内以英文逗号分隔,您也可以重复使用该标志来添加更多过滤条件。只有符合所有过滤条件的事件会被发送到目的地。不支持通配符和正则表达式;但是,使用 --event-filters-path-pattern 标志时,您可以定义资源路径模式
  • --service-account 标志用于指定与触发器关联的 Identity and Access Management (IAM) 服务账号电子邮件地址。

示例:

  gcloud eventarc triggers create helloworld-trigger \
      --location=us-central1 \
      --destination-gke-cluster=gke-events-cluster \
      --destination-gke-location=us-central1-a \
      --destination-gke-namespace=default \
      --destination-gke-service=helloworld-events \
      --destination-gke-path=/ \
      --event-filters="type=google.cloud.metastore.federation.v1.updated" \
      --event-filters-path-pattern="federation=my-federation-*" \
      --service-account=${SERVICE_ACCOUNT_NAME}@${PROJECT_ID}.iam.gserviceaccount.com

此命令会为标识为 google.cloud.metastore.federation.v1.updated 的事件创建一个名为 helloworld-trigger 的触发器,并针对以 my-federation- 开头的 federation ID 匹配事件。

Terraform

您可以使用 Terraform 为 GKE 目标创建触发器。如需了解详情,请参阅使用 Terraform 创建触发器

列出触发器

如需确认触发器已创建,您可以使用 Google Cloud CLI 或通过 Google Cloud 控制台列出 Eventarc 触发器。

控制台

  1. 在 Google Cloud 控制台中,进入 Eventarc 触发器页面。

    转到“触发器”

    此页面会列出所有位置的触发器,并包含名称、区域、事件提供方、目标位置等详细信息。

  2. 如需过滤触发器,请执行以下操作:

    1. 点击 过滤过滤触发器字段。
    2. 属性列表中,选择要作为触发器过滤条件的选项。

    您可以选择单个属性,或使用逻辑运算符 OR 添加更多属性。

  3. 如需对触发器进行排序,请点击任意受支持的列标题旁边的 排序

gcloud

运行以下命令可列出触发器:

gcloud eventarc triggers list --location=-

此命令会列出所有位置的触发器,并包含名称、类型、目标位置和状态等详细信息。

后续步骤