Abilita l'operatore Ray su Google Kubernetes Engine (GKE)


Questa pagina mostra come attivare l'operatore Ray per Google Kubernetes Engine (GKE), consentendoti di utilizzare le API KubeRay per scalare e gestire i cluster Ray. Per ulteriori informazioni su Ray e KubeRay, consulta la panoramica di Ray su GKE.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

  • Attiva l'API Google Kubernetes Engine.
  • Attiva l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installa e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, ottieni la versione più recente eseguendo gcloud components update.

Abilita l'operatore Ray per un cluster

Puoi attivare l'operatore Ray su cluster GKE Autopilot o GKE standard nuovi o esistenti utilizzando Google Cloud CLI, la console Google Cloud o Terraform.

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud.

    Vai a Google Kubernetes Engine

  2. Fai clic su Crea, quindi nella sezione Standard o Autopilot fai clic su Configura.

  3. Per Standard, nel riquadro di navigazione, fai clic su Funzionalità in Cluster. Per Autopilot, fai clic su Impostazioni avanzate.

  4. Nella sezione AI e machine learning, seleziona la casella di controllo Attiva operatore Ray.

  5. Fai clic su Crea.

gcloud

Crea un cluster utilizzando l'opzione --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del nuovo cluster.
  • VERSION: la versione GKE, che deve essere 1.30.0-gke.1747000 o successiva. Puoi anche utilizzare l'opzione --release-channel per selezionare un canale di uscita. Il canale di rilascio deve avere una versione predefinita di 1.30.0-gke.1747000 o successiva.

Puoi attivare l'operatore Ray su un cluster esistente utilizzando il comando gcloud container clusters update con l'opzione --update-addons=RayOperator=ENABLED.

Terraform

Il seguente esempio di Terraform crea e configura un cluster standard:

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Per scoprire di più sull'utilizzo di Terraform, consulta Assistenza di Terraform per GKE.

Controllo delle versioni

L'operatore Ray è disponibile nelle seguenti versioni minori di GKE con una versione KubeRay corrispondente:

Versione secondaria di GKE Versione KubeRay
1,31 v1.2
1,30 v1.1
1,29 v1.1

Verificare che l'operatore Ray sia abilitato

Puoi verificare che l'operatore Ray sia abilitato su un cluster GKE Autopilot o standard utilizzando la gcloud CLI o la console Google Cloud.

Console

  1. Vai alla pagina Google Kubernetes Engine nella console Google Cloud.

    Vai a Google Kubernetes Engine

  2. Nell'elenco dei cluster, fai clic sul nome del cluster da verificare.

  3. Nella sezione Funzionalità, verifica che la casella di controllo Operatore raggio sia selezionata.

gcloud

Descrivi il tuo cluster:

gcloud container clusters describe CLUSTER_NAME

Sostituisci CLUSTER_NAME con il nome del cluster.

L'output è simile al seguente

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Questo output indica che l'operatore Ray è abilitato per il cluster.

Passaggi successivi