Abilita l'operatore Ray su Google Kubernetes Engine (GKE)


Questa pagina mostra come attivare l'operatore Ray per Google Kubernetes Engine (GKE), consentendoti di utilizzare le API KubeRay per scalare e gestire i cluster Ray. Per maggiori informazioni su Ray e KubeRay, consulta la panoramica di Ray su GKE.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

  • Attiva l'API Google Kubernetes Engine.
  • Attiva l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installa e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica la versione più recente eseguendo gcloud components update.

Abilita l'operatore Ray per un cluster

Puoi attivare l'operatore Ray su cluster GKE Autopilot o GKE standard nuovi o esistenti utilizzando gcloud CLI, la console Google Cloud o Terraform.

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud.

    Vai a Google Kubernetes Engine

  2. Fai clic su Crea, quindi nella sezione Standard o Autopilot fai clic su Configura.

  3. Per Standard, nel riquadro di navigazione, in Cluster, fai clic su Funzionalità. Per Autopilot, fai clic su Impostazioni avanzate.

  4. Nella sezione IA e machine learning, seleziona Abilita operatore Ray casella di controllo.

  5. Fai clic su Crea.

gcloud

Crea un cluster utilizzando l'opzione --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del nuovo cluster.
  • VERSION: la versione GKE, che deve essere 1.30.0-gke.1747000 o successiva. Puoi utilizzare anche --release-channel per selezionare un canale di rilascio. La il canale di rilascio deve avere la versione predefinita 1.30.0-gke.1747000 o in un secondo momento.

Puoi abilitare l'operatore Ray su un cluster esistente utilizzando il metodo gcloud container clusters update con l'opzione --update-addons=RayOperator=ENABLED.

Terraform

Il seguente esempio di Terraform crea e configura un cluster standard:

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Per scoprire di più sull'utilizzo di Terraform, consulta Assistenza di Terraform per GKE.

Controllo delle versioni

L'operatore Ray è disponibile nelle seguenti versioni secondarie di GKE con una versione KubeRay corrispondente:

Versione secondaria di GKE Versione KubeRay
1,31 v1.2
1,30 v1.1
1,29 v1.1

Verificare che l'operatore Ray sia abilitato

Puoi verificare che l'operatore Ray sia abilitato su un cluster GKE Autopilot o standard utilizzando la CLI gcloud o la console Google Cloud.

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud.

    Vai a Google Kubernetes Engine

  2. Nell'elenco dei cluster, fai clic sul nome del cluster che vuoi verificare.

  3. Nella sezione Funzionalità, verifica che la casella di controllo Operatore Ray sia selezionato.

gcloud

Descrivi il tuo cluster:

gcloud container clusters describe CLUSTER_NAME

Sostituisci CLUSTER_NAME con il nome del cluster.

L'output è simile al seguente

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Questo output indica che l'operatore Ray è abilitato per il cluster.

Passaggi successivi