Habilita el operador de Ray en Google Kubernetes Engine (GKE)


En esta página, se muestra cómo habilitar el operador de Ray para Google Kubernetes Engine (GKE), lo que te permite usar las APIs de KubeRay a fin de escalar y administrar clústeres de Ray. Para obtener más información sobre Ray y KubeRay, consulta Descripción general de Ray en GKE.

Antes de comenzar

Antes de comenzar, asegúrate de haber realizado las siguientes tareas:

  • Habilita la API de Google Kubernetes Engine.
  • Habilitar la API de Google Kubernetes Engine
  • Si deseas usar Google Cloud CLI para esta tarea, instala y, luego, inicializa gcloud CLI. Si ya instalaste gcloud CLI, ejecuta gcloud components update para obtener la versión más reciente.

Habilita el operador de Ray para un clúster

Puedes habilitar el operador de Ray en clústeres nuevos o existentes de Autopilot o Standard de GKE mediante Google Cloud CLI, la consola de Google Cloud o Terraform.

Console

  1. Ve a la página de Google Kubernetes Engine en la consola de Google Cloud.

    Ir a Google Kubernetes Engine

  2. Haz clic en Crear y, luego, en la sección Standard o Autopilot, haz clic en Configurar.

  3. En el caso de Standard, en el panel de navegación, en Clúster, haz clic en Funciones. En Autopilot, haz clic en Configuración avanzada.

  4. En la sección IA y aprendizaje automático, selecciona la casilla de verificación Habilitar operador de Ray.

  5. Haz clic en Crear.

gcloud

Crea un clúster con la opción --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Reemplaza lo siguiente:

  • CLUSTER_NAME es el nombre del clúster nuevo.
  • VERSION: la versión de GKE, que debe ser 1.30.0-gke.1747000 o posterior. También puedes usar la opción --release-channel para seleccionar un canal de versiones. El canal de versiones debe tener una versión predeterminada de 1.30.0-gke.1747000 o posterior.

Puedes habilitar el operador de Ray en un clúster existente mediante el comando gcloud container clusters update con la opción --update-addons=RayOperator=ENABLED.

Terraform

En el siguiente ejemplo de Terraform, se crea y configura un clúster Standard:

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Si deseas obtener más información sobre el uso de Terraform, consulta Compatibilidad con Terraform para GKE.

Control de versiones

El operador de Ray está disponible en las siguientes versiones secundarias de GKE con una versión correspondiente de KubeRay:

Versión secundaria de GKE Versión de KubeRay
1.31 v1.2
1.30 v1.1
1.29 v1.1

Verifica que el operador de Ray esté habilitado

Puedes verificar que el operador de Ray esté habilitado en un clúster de GKE Autopilot o Standard mediante gcloud CLI o la consola de Google Cloud.

Console

  1. Ve a la página de Google Kubernetes Engine en la consola de Google Cloud.

    Ir a Google Kubernetes Engine

  2. En la lista de clústeres, haz clic en el nombre del clúster que deseas verificar.

  3. En la sección Características, confirma que la casilla de verificación Operador de Ray esté seleccionada.

gcloud

Describe tu clúster:

gcloud container clusters describe CLUSTER_NAME

Reemplaza CLUSTER_NAME por el nombre del clúster.

El resultado es similar al que se muestra a continuación:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Este resultado indica que el operador de Ray está habilitado para el clúster.

¿Qué sigue?