Habilitar el operador de Ray en Google Kubernetes Engine (GKE)


En esta página se explica cómo habilitar el operador de Ray para Google Kubernetes Engine (GKE), lo que te permite usar las APIs de KubeRay para escalar y gestionar clústeres de Ray. Para obtener más información sobre Ray y KubeRay, consulta la información general sobre Ray en GKE.

Antes de empezar

Antes de empezar, asegúrate de haber realizado las siguientes tareas:

  • Habilita la API de Google Kubernetes Engine.
  • Habilitar la API de Google Kubernetes Engine
  • Si quieres usar Google Cloud CLI para esta tarea, instálala y, a continuación, inicialízala. Si ya has instalado la gcloud CLI, obtén la versión más reciente ejecutando gcloud components update.

Habilitar el operador de Ray en un clúster

Puedes habilitar el operador de Ray en clústeres de Autopilot o Standard de GKE nuevos o ya creados mediante la CLI de Google Cloud, la Google Cloud consola o Terraform.

Consola

  1. Ve a la página Google Kubernetes Engine en la Google Cloud consola.

    Ir a Google Kubernetes Engine

  2. Haz clic en Crear y, a continuación, en la sección Estándar o Autopiloto, haz clic en Configurar.

  3. En Standard, en el panel de navegación, ve a Clúster y haz clic en Funciones. En Autopiloto, haz clic en Configuración avanzada.

  4. En la sección IA y aprendizaje automático, selecciona la casilla Habilitar operador Ray.

  5. Haz clic en Crear.

gcloud

Crea un clúster con la opción --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Haz los cambios siguientes:

  • CLUSTER_NAME: el nombre del nuevo clúster.
  • VERSION: la versión de GKE, que debe ser la 1.30.0-gke.1747000 o una posterior. También puedes usar la opción --release-channel para seleccionar un canal de lanzamiento. El canal de lanzamiento debe tener una versión predeterminada 1.30.0-gke.1747000 o posterior.

Puedes habilitar el operador Ray en un clúster que ya tengas con el comando gcloud container clusters update y la opción --update-addons=RayOperator=ENABLED.

Terraform

En el siguiente ejemplo de Terraform se crea y se configura un clúster Standard:

resource "google_container_cluster" "default" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }
}

Para obtener más información sobre el uso de Terraform, consulta Compatibilidad de Terraform con GKE.

Gestión de versiones

Ray Operator está disponible en las siguientes versiones secundarias de GKE con la versión de KubeRay correspondiente:

Versión secundaria de GKE Versión de KubeRay
1,33 v1.3
1.32 v1.2
1.31 v1.2
1.30 v1.1
1,29 v1.1

Verificar que el operador Ray esté habilitado

Puedes verificar que el operador de Ray está habilitado en un clúster de Autopilot o Estándar de GKE mediante la CLI de gcloud o la consola de Google Cloud .

Consola

  1. Ve a la página Google Kubernetes Engine en la Google Cloud consola.

    Ir a Google Kubernetes Engine

  2. En la lista de clústeres, haz clic en el nombre del clúster que quieras verificar.

  3. En la sección Funciones, comprueba que la casilla Operador de rayos esté marcada.

gcloud

Describe tu clúster:

gcloud container clusters describe CLUSTER_NAME

Sustituye CLUSTER_NAME por el nombre del clúster.

La salida es similar a la siguiente:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Esta salida indica que el operador de Ray está habilitado en el clúster.

Siguientes pasos