Abilita l'operatore Ray su Google Kubernetes Engine (GKE)


Questa pagina mostra come attivare l'operatore Ray per Google Kubernetes Engine (GKE), consentendoti di utilizzare le API KubeRay per scalare e gestire i cluster Ray. Per maggiori informazioni su Ray e KubeRay, consulta Panoramica di Ray su GKE.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

  • Attiva l'API Google Kubernetes Engine.
  • Attiva l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installala e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima versione eseguendo gcloud components update.

Abilita l'operatore Ray per un cluster

Puoi attivare l'operatore Ray su cluster GKE Autopilot o Standard nuovi o esistenti utilizzando Google Cloud CLI, la console Google Cloud o Terraform.

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud .

    Vai a Google Kubernetes Engine

  2. Fai clic su Crea, poi fai clic su Configura nella sezione Standard o Autopilot.

  3. Per Standard, nel riquadro di navigazione, in Cluster, fai clic su Funzionalità. Per Autopilot, fai clic su Impostazioni avanzate.

  4. Nella sezione AI e machine learning, seleziona la casella di controllo Attiva operatore Ray.

  5. Fai clic su Crea.

gcloud

Crea un cluster utilizzando l'opzione --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del nuovo cluster.
  • VERSION: la versione di GKE, che deve essere 1.30.0-gke.1747000 o successive. Puoi anche utilizzare l'opzione --release-channel per selezionare un canale di rilascio. Il canale di rilascio deve avere una versione predefinita 1.30.0-gke.1747000 o successiva.

Puoi abilitare l'operatore Ray su un cluster esistente utilizzando il comando gcloud container clusters update con l'opzione --update-addons=RayOperator=ENABLED.

Terraform

Il seguente esempio Terraform crea e configura un cluster Standard:

resource "google_container_cluster" "default" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }
}

Per scoprire di più sull'utilizzo di Terraform, consulta Supporto di Terraform per GKE.

Controllo delle versioni

L'operatore Ray è disponibile nelle seguenti versioni secondarie di GKE con una versione KubeRay corrispondente:

Versione secondaria di GKE Versione di KubeRay
1,33 v1.3
1.32 v1.2
1,31 v1.2
1,30 v1.1
1,29 v1.1

Verifica che l'operatore Ray sia abilitato

Puoi verificare che l'operatore Ray sia abilitato su un cluster GKE Autopilot o Standard utilizzando gcloud CLI o la console Google Cloud .

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud .

    Vai a Google Kubernetes Engine

  2. Nell'elenco dei cluster, fai clic sul nome del cluster che vuoi verificare.

  3. Nella sezione Funzionalità, verifica che la casella di controllo Ray Operator sia selezionata.

gcloud

Descrivi il tuo cluster:

gcloud container clusters describe CLUSTER_NAME

Sostituisci CLUSTER_NAME con il nome del cluster.

L'output è simile al seguente:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Questo output indica che l'operatore Ray è abilitato per il cluster.

Passaggi successivi