Ray-Operator in Google Kubernetes Engine (GKE) aktivieren


Auf dieser Seite wird gezeigt, wie Sie den Ray-Operator für Google Kubernetes Engine (GKE) aktivieren, damit Sie die KubeRay APIs zum Skalieren und Verwalten von Ray-Clustern verwenden können. Weitere Informationen zu Ray und KubeRay finden Sie unter Ray in GKE – Übersicht.

Hinweise

Führen Sie die folgenden Schritte durch, bevor Sie beginnen:

  • Aktivieren Sie die Google Kubernetes Engine API.
  • Google Kubernetes Engine API aktivieren
  • Wenn Sie die Google Cloud CLI für diese Aufgabe verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit gcloud components update ab.

Ray-Operator für einen Cluster aktivieren

Sie können den Ray-Operator in neuen oder vorhandenen Autopilot- oder Standard-GKE-Clustern mit der Google Cloud CLI, der Google Cloud Console oder Terraform aktivieren.

Console

  1. Rufen Sie in der Google Cloud Console die Seite Google Kubernetes Engine auf.

    Zur Seite "Google Kubernetes Engine"

  2. Klicken Sie auf Erstellen und dann im Bereich „Standard“ oder „Autopilot“ auf Konfigurieren.

  3. Klicken Sie für Standard im Navigationsbereich unter Cluster auf Features. Klicken Sie bei Autopilot auf Erweiterte Einstellungen.

  4. Klicken Sie im Bereich KI und maschinelles Lernen das Kästchen Ray-Operator aktivieren an.

  5. Klicken Sie auf Erstellen.

gcloud

Erstellen Sie einen Cluster mit der Option --addons=RayOperator:

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

Ersetzen Sie Folgendes:

  • CLUSTER_NAME ist der Name des neuen Clusters.
  • VERSION: die GKE-Version, die mindestens 1.30.0-gke.1747000 sein muss. Sie können auch die Option --release-channel verwenden, um eine Release-Version auszuwählen. Die Release-Version muss die Standardversion 1.30.0-gke.1747000 oder höher haben.

Sie können den Ray-Operator in einem vorhandenen Cluster mit dem Befehl gcloud container clusters update und der Option --update-addons=RayOperator=ENABLED aktivieren.

Terraform

Im folgenden Terraform-Beispiel wird ein Standardcluster erstellt und konfiguriert:

resource "google_container_cluster" "ray-cluster" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }

  # Set `deletion_protection` to `true` will ensure that one cannot
  # accidentally delete this instance by use of Terraform.
  deletion_protection = false
}

Weitere Informationen zur Verwendung von Terraform finden Sie unter Terraform-Unterstützung für GKE.

Versionsverwaltung

Der Ray-Operator ist in den folgenden GKE-Nebenversionen mit einer entsprechenden KubeRay-Version verfügbar:

GKE-Nebenversion KubeRay-Version
1,31 v1.2
1,30 v1.1
1,29 v1.1

Prüfen, ob der Ray-Operator aktiviert ist

Sie können prüfen, ob der Ray-Operator auf einem Autopilot- oder Standard-GKE-Cluster mit der gcloud CLI oder der Google Cloud Console aktiviert ist.

Console

  1. Rufen Sie in der Google Cloud Console die Seite Google Kubernetes Engine auf.

    Zur Seite "Google Kubernetes Engine"

  2. Klicken Sie in der Clusterliste auf den Namen des Clusters, den Sie bestätigen möchten.

  3. Prüfen Sie im Abschnitt Funktionen, ob das Kästchen Ray-Operator angeklickt ist.

gcloud

Cluster beschreiben:

gcloud container clusters describe CLUSTER_NAME

Ersetzen Sie CLUSTER_NAME durch den Namen des Clusters.

Die Ausgabe sieht etwa so aus:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

Diese Ausgabe gibt an, dass der Ray-Operator für den Cluster aktiviert ist.

Nächste Schritte